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Abstract 


Supporting human operators in monitoring tasks plays an increasingly im- 
portant role, as the sheer volume of data from heterogeneous sensors can be 
overwhelming. It is crucial that the most important information for critical 
decisions is presented transparently to humans in order to strengthen situa- 
tional awareness. In this thesis, the maritime space is used as an example for 
the development of different data fusion methods for this very purpose. 


The maritime space as an application scenario offers a well suited environment 
for testing the methods due to its enormous economic importance for world 
trade, the occurrence of various anomalies and criminal acts such as piracy 
and illegal fishing, and the availability of data sources. 


The developed and investigated methods cover the whole range from sim- 
ple positional and kinematic anomalies to contextual anomalies and complex 
anomalies. Various data sets with real vessel traffic information are used for 
the investigation. In addition, the procedures are partially tested in live trials 
with coast guards as end users. 


To develop the procedures, the Object-Oriented World Model is first extended 
by behavioural models as a basis, and the EUCISE data model is identified as 
a foundation for modelling the available background knowledge. The first 
investigated methods detect anomalies in position and kinematics based on 
single data points or entire trajectories. While some anomalies are detected, 
the misclassification rates are significantly too high for actual use and cer- 
tain anomalies cannot be determined without further knowledge about the 
context. 


In the next step, a multi-agent system is set up that simulates the behaviour 
of the observed objects by means of game-theoretic models. The necessary 
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utility functions are derived both knowledge-based and data-driven. With 
the integrated context information, the identification of real anomalies can 
be improved. 


Furthermore, it is shown how context information can be integrated into neu- 
ral networks for the classification of ship types using features derived from 
georeferenced information. 


In the last step, complex anomalies in the form of specific situations are mod- 
elled based on dynamic Bayesian Networks and evaluated in live trials. Con- 
textual information, such as the weather, as well as data sources with varying 
reliability are integrated in order to recognize different scenarios co-designed 
by end users. 


Overall, it is shown that automatic methods can detect anomalies of different 
types. The methods are evaluated with real data to show the possibility of 
their actual use as decision support for humans in real application scenarios. 
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Kurzfassung 


Eine Unterstiitzung des Menschen in Uberwachungsaufgaben spielt eine im- 
mer wichtigere Rolle, da die schiere Menge der anfallenden Daten von hete- 
rogenen Sensoren eine Überforderung des Menschen zur Folge hat. Hierfür 
müssen dem Menschen in kritischen Entscheidungen die wichtigsten Infor- 
mationen transparent dargebracht werden, um so das Situationsbewusstsein 
zu stärken. In dieser Arbeit wird der maritime Raum als Beispiel für die Ent- 
wicklung verschiedener Datenfusionsverfahren zu ebendiesem Zweck heran- 
gezogen. 


Der maritime Raum als Anwendungsszenario bietet durch seine enorme 
wirtschaftliche Bedeutung für den Welthandel, das Auftreten verschiedenster 
Anomalien und krimineller Handlungen wie Piraterie und illegaler Fische- 
rei und die Verfügbarkeit von Datenquellen ein gut für die Erprobung der 
Verfahren geeignetes Umfeld. 


Die entwickelten und untersuchten Verfahren decken hierbei die gesam- 
te Bandbreite von einfachen Positions- und kinematischen Anomalien, 
über kontextuelle Anomalien bis zu komplexen Anomalien ab. Für die 
Untersuchung werden verschiedene Datensätze mit realen Schiffsverkehrs- 
informationen genutzt. Außerdem werden die Verfahren teilweise in Live 
Trials mit Küstenwachen erprobt. 


Zur Entwicklung der Verfahren wird als Grundlage zunächst das objektorien- 
tierte Weltmodell um Verhaltensmodelle erweitert sowie das EUCISE-Daten- 
modell als Basis für die Modellierung des verfügbaren Hintergrundwissens 
identifiziert. Die ersten untersuchten Verfahren detektieren Anomalien in der 
Position und der Kinematik basierend auf einzelnen Datenpunkten oder gan- 
zen Trajektorien. Hierbei wurde festgestellt, dass zwar Anomalien erkannt 
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werden, die Korrektklassifikationsrate für einen tatsächlichen Einsatz aber 
deutlich zu hoch ausfällt sowie bestimmte Anomalien ohne Kontext nicht be- 
stimmbar sind. 


Im nächsten Schritt wird ein Multiagentensystem aufgestellt, welches das Ver- 
halten der beobachteten Objekte durch spieltheoretische Modelle simuliert. 
Die hierzu notwendigen Nutzenfunktionen werden sowohl wissensbasiert als 
auch datengetrieben hergeleitet. Mit den integrierten Kontextinformationen 
können echte Anomalien deutlich besser von normalem Verhalten abgegrenzt 
werden. 


Des Weiteren wird gezeigt, wie mit Hilfe von Merkmalen, die aus georeferen- 
zierten Informationen abgeleitet werden, Kontextinformationen zur Klassifi- 
kation von Schiffstypen in neuronalen Netzen integriert werden können. 


Im letzten Schritt werden komplexe Anomalien in Form von spezifischen Si- 
tuationen basierend auf dynamischen Bayes’schen Netzen modelliert und in 
Live Trials erprobt. Hierbei werden Kontextinformationen, wie das Wetter, 
sowie Datenquellen mit unterschiedlicher Zuverlässigkeit integriert, um Si- 
tuationen in verschiedenen durch Endanwender/-innen mitgestalteten An- 
wendungsszenarien zu erkennen. 


Insgesamt wird gezeigt, dass mit automatischen Verfahren Anomalien unter- 
schiedlicher Art erkannt werden können. Die Verfahren werden jeweils mit 
realen Daten evaluiert, um die Möglichkeit des tatsächlichen Einsatzes als 
Entscheidungsunterstützung für Menschen in realen Anwendungsszenarien 
aufzuzeigen. 
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1 Einleitung 


»Alles, was entsteht, tut dies im Kontext zahlloser Ursachen 
und Bedingungen.« 


— Dalai Lama 


1.1 Motivation 


Die Weltmeere haben eine enorme wirtschaftliche Bedeutung und ermögli- 
chen den weltweiten Handel mit Gütern. Laut der Konferenz der Vereinten 
Nationen für Handel und Entwicklung [UNC20, S. 29] wurden im Jahr 2019 
rund 80 % des Welthandels über den Schiffsverkehr abgewickelt. Schätzungs- 
weise 793,26 Mio. TEU’ wurden weltweit in Containerhäfen umgeschlagen. 
Dabei bestand die Welthandelsflotte aus 95 402 Schiffen, mit einer Tragfähig- 
keit von 1,97 Mrd. dwt? - ein Wachstum der Gesamttragfahigkeit um 2,61% 
zum Vorjahr. Mit 42,6% - eine Steigerung um 2,87 % zum Vorjahr - entfällt 
auf Schüttgutfrachter der größte Teil der Tragfähigkeit, gefolgt von Öltankern 
mit 28,7% — eine Steigerung um 0,98% zum Vorjahr. Containerschiffe mach- 
ten 13,4 % - eine Steigerung um 4,89 % zum Vorjahr - der Gesamttragfähigkeit 
aus. Der Bedarf an neuen Containerschiffen mit einem Ladungsvolumen von 
mehr als 15000 TEU wuchs dabei im Vergleich zu 2018 um 33 %. Insgesamt 
wird geschätzt, dass mehr als 1,6 Mio. Menschen auf internationalen Han- 
delsschiffen arbeiten. 


* Engl. »twenty-foot equivalent unit«, dt. »Zwanzig-Fuß-Standardcontainer«. 
2 Engl. »deadweight tonnages« als Maßeinheit für die Gesamttragfähigkeit eines Schiffes. 
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Neben diesem hohen Stellenwert fiir den Welthandel dienen die Weltmee- 
re auch als Grundlage fiir weitere Wirtschaftszweige. Laut der Ernahrungs- 
und Landwirtschaftsorganisation der Vereinten Nationen [FAO20, S. 3] stieg 
im Jahr 2018 der weltweite Gesamtfang an Fisch um 5,4% im Vergleich zum 
Durchschnitt der vorherigen drei Jahre auf 96,4 Mio. Tonnen Fisch (Lebend- 
gewicht). Im Jahr 2018 arbeiteten geschätzt 38,98 Mio. Menschen im Primär- 
sektor Fischerei. Im Jahr 2018 wurden 67 Mio. Tonnen Fisch (Lebendgewicht) 
mit einem Gesamtexportwert von 164 Mrd. US-Dollar international gehandelt. 
Dies entspricht fast 38 % aller weltweit gefangenen oder gezüchteten Fische. 


Im Bereich der Tourismusbranche erfreuten sich Kreuzfahrten in den letzten 
Jahren immer größerer Beliebtheit. Vor dem COVID-19-Ausbruch konnte die 
Anzahl der Reisenden laut der Cruise Lines International Association [CLI20] 
im Durchschnitt der letzten 10 Jahre um jeweils über 5 % gesteigert werden. 


Durch diese wirtschaftlichen Erfolge entstehen jedoch unterschiedliche Ge- 
fahren und Probleme.” Laut dem International Maritime Bureau der Interna- 
tionalen Handelskammer (ICC) [ICC20] wurden 2019 insgesamt 162 versuch- 
te und erfolgreiche Piratenangriffe sowie bewaffnete Überfälle gemeldet. Im 
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Abbildung 1.1: Durch das ICC International Maritime Bureau erfasste Piratenangriffe und be- 
waffnete Überfälle in den Jahren 2009 bis 2019 


> https://www.sueddeutsche.de/wissen/digitale-suche-piraten-1.4274342, letzter Abruf am 
04.03.2020. 
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Vergleich dazu wurde zwischen 2015 und 2019 im Mittelwert 196 Falle re- 
gistriert. Die gemeldeten Vorfälle der letzten 10 Jahre sind in Abbildung 1.1 
dargestellt. Hier ist ein Abwärtstrend der Fallzahlen zu beobachten, jedoch 
wurden laut [One20] zwischen 2018 und 2019 ein Anstieg der gekidnappten 
Besatzungsmitglieder um 60 % festgestellt. 


Um nachhaltigen Fischfang zu ermöglichen, ist es wichtig, TUU(engl. »illegal, 
unreported and unregulated«)-Fischerei zu verhindern. Schätzungen [Agn09] 
nach entsteht durch IUU-Fischerei ein jährlicher wirtschaftlicher Schaden 
zwischen 10 und 23,5 Mrd. US-Dollar. Dies entspricht einer Fangmenge 
zwischen 11 und 26 Mio. Tonnen. 


Weiterhin kommt es auf hoher See immer wieder zu Seeunglücken und Hava- 
rien. So wurden der Bundesstelle für Seeunfalluntersuchung für die Jahre 2018 
und 2019 jeweils 112 Seeunfälle gemeldet [BSU20]. In den letzten Jahren kam 
es auf (europäischen) Gewässern immer wieder zu Kollisionen zwischen ver- 
schiedenen Schiffen, z.B. kollidierten im Ärmelkanal am 01.07.2017 ein Mas- 
sengutfrachter und ein Öltanker [MAI18], am 20.03.2018 ein Stückgutfrach- 
ter und ein Fischerboot [MSI19] und am 19.02.2019 in der Ostsee ein Stück- 
gutfrachter und ein Besatzungsversorgungsschiff [DMA19]. Beim zuletzt ge- 
nannten Unfall kam es neben den Schäden am Schiff auch zu Verletzungen 
der Besatzungsmitglieder. 


Die wirtschaftliche Bedeutung auf der einen und die Gefahren und Proble- 
me auf der anderen Seite zeigen deutlich die Wichtigkeit der Kontrolle und 
Überwachung des maritimen Raums. Als Exportnation wurden hierzu bspw. 
in Deutschland durch das Bundesministerium für Wirtschaft und Energie ver- 
schiedene maritime Forschungsprogramme [Bun17] mit dem Ziel ausgelobt, 
die maritime Wirtschaft zu stärken. Zu den geförderten Anwendungsfeldern 
gehören dabei auf dem Gebiet der »Echtzeittechnologien für die Maritime Si- 
cherheit« unter anderem: 


« »Schutz maritimer Infrastrukturen und der dort beschäftigten 
Menschen, 


« Überwachung maritimer Gebiete zur Prävention illegaler Aktivitäten, 
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« Schutz und Sicherung der globalen Versorgungskette, 


e Sicherheit der maritimen Transportsysteme sowie der Seefahrer und 
Passagiere, 


e mariner Umweltschutz durch Beobachtung und Vermeidung von 
Unfällen.« [Bun17] 


Innerhalb der Europäischen Union (EU) sind von den 27 Mitgliedstaaten 22 
Küstenanrainerstaaten. Diese sind für die Kontrolle und Überwachung einer 
Küstenlinie von über 68 000 km verantwortlich. Daher wurde innerhalb der 
EU als Antwort auf die globalen Herausforderungen und Fragestellungen zum 
Thema der maritimen Sicherheit die EU-Strategie für maritime Sicherheit (EU- 
MSS) [Cou14] entwickelt. Die Sicherheit im Seeverkehr ist ein gemeinsames 
Bedürfnis für das Wohlergehen und den Wohlstand der EU und der Welt. Die 
Meere fördern das Wachstum und erbringen wichtige Umweltleistungen. Ihre 
Sicherheit ist Teil des Fundaments, auf dem unsere Gesellschaft aufbaut. Die 
EUMSS basiert auf der Verbesserung der Zusammenarbeit über Grenzen und 
Sektoren hinweg, um Stabilität, Rechtsstaatlichkeit und verantwortungsvolle 
Regierungsführung im globalen maritimen Bereich zu fördern. 


Die EUMSS ist ein gemeinsames Unterfangen aller zivilen und militärischen 
Behörden der EU und der Mitgliedstaaten. Sie ruft alle Beteiligten dazu auf, 
sich zu engagieren und die EU mit kritischen Kapazitäten auszustatten, um ei- 
nen einheitlichen Rahmen für eine kohärente Entwicklung und gemeinsame 
Reaktion zu schaffen. Um ihre Ziele nachhaltiger zu erreichen, fördert diese 
Strategie die multilaterale Zusammenarbeit mit internationalen Foren, regio- 
nalen Organisationen und Drittstaaten. 


Die vier Grundprinzipien der EUMSS bilden hierbei ein sektorübergreifender 
Ansatz, die funktionale Integrität, ein maritimer Multilateralismus sowie die 
Achtung von Regeln und Prinzipien. Die Strategie soll dazu dienen, dass die 
Kooperation aller relevanten Akteure zur besseren Koordination und Bewäl- 
tigung der komplexen und ineinander verwobenen Herausforderungen opti- 
miert wird; die Zusammenarbeit innerhalb der EU fundiert auf bestehenden 


1.2 Zielsetzung der Arbeit 


Verantwortlichkeiten und Kompetenzen gestarkt wird: die EU bei der Zusam- 
menarbeit mit internationalen Organisationen, Drittstaaten und privaten In- 
teressenvertretern als einheitliche, kohärente Stimme wahrgenommen wird; 
die geteilte, transparente und regelbasierte Führung zugunsten der Stabilität 
und der Umwelt unter Achtung der Menschenrechte und des Seerechtsüber- 
einkommens erfolgt. 


Um die Zusammenarbeit zwischen Behörden zu verbessern und damit Dop- 
pelarbeit und ein fragmentiertes Situationsbewusstsein zu verhindern, wird 
das Common Information Sharing Environment (CISE) aufgebaut, durch das 
existierende nationale und EU-weite Systeme miteinander vernetzt werden. 
Darüber hinaus werden die Forschung und Innovation gestärkt, indem in For- 
schungsrahmenprogrammen diese Thematiken adressiert werden. 


Die so ausgeschriebenen Forschungsprogramme sehen die Stärkung des Si- 
tuationsbewusstseins durch den Einsatz neuartiger Technologien zur Verar- 
beitung und Präsentation von maritimen Informationen für Behörden und 
andere Akteure aus der Privatwirtschaft oder nicht staatliche Seenotrettungs- 
dienste als einen wichtigen Punkt, um den Problemen und Herausforderun- 
gen gerecht zu werden. 


1.2 Zielsetzung der Arbeit 


Ziel dieser Arbeit ist es, verschiedene Verfahren zu entwickeln, die es ermögli- 
chen, das Situationsbewusstsein eines/einer Anwenders/Anwenderin bei der 
Durchführung von Überwachungsaufgaben (z.B. Küstenwachen und Seenot- 
rettung) zu stärken. Diese Verfahren sind Teil von Entscheidungsunterstüt- 
zungssystemen (EUS) und sollen dem Menschen bei der Verarbeitung und 
Analyse immer größer werdender Mengen an verfügbaren heterogenen Sen- 
sordaten eine Hilfestellung geben. Hierbei stellt sich die Frage, wie komplex 
die Verfahren gewählt werden müssen, um unterschiedliche Situationen von 
Interesse erkennen zu können. 


1 Einleitung 


Basierend auf dieser Fragestellung werden verschiedene datengetriebene und 
wissensbasierte Verfahren für die maritime Anwendungsdomäne implemen- 
tiert und erprobt. Hierbei soll unter anderem auch gezeigt werden, wie wis- 
sensbasierte Verfahren mit Hilfe von maschinellen Lernverfahren unterstiitzt 
werden können. Um diese Aufgabe zu erfüllen, wird ein vorhandenes Welt- 
modell um Verhaltensmodelle erweitert. 


In einem realen Einsatzszenario sollen die Verfahren kritische Situationen 
zeitnah erkennen können. Daher werden sie mit realen Daten erprobt, um si- 
cherzustellen, dass nicht nur Situationen in rein synthetischen Daten erkannt 
werden bzw. dass nicht nur künstliche Anomalien detektiert werden, die nur 
schwer Rückschlüsse auf das Verhalten mit realen Daten ziehen lassen. 


Aus dem Ziel, Verfahren zur Situationserkennung für die Verwendung in EUS 
bereitzustellen, können die folgenden drei Hypothesen abgeleitet werden: 


Hypothese 1: Der Einsatz maschineller Lernverfahren zur Unterstützung der 
Anwender/-innen in maritimen Überwachungsszenarien benötigt die 
Integration von Kontextwissen, um komplexere Situationen abdecken 
zu können. 


Hypothese 2: Die Einbindung von Verhaltensmodellen für die Repräsentan- 
ten und Konzepte zur Interaktion untereinander in das Objektorientier- 
te Weltmodell ermöglicht die Prädiktion von plausiblem Verhalten. 


Hypothese 3: Es ist möglich, komplexe Situationen unter Einbindung von 
Kontextinformationen und unsicheren Datenquellen in Echtzeit in rea- 
len Anwendungsszenarien zu erkennen. 


1.3 Eigene wissenschaftliche Beiträge 


Basierend auf der Zielsetzung und den abgeleiteten Hypothesen liefert diese 
Arbeit in den folgenden Bereichen Beiträge: 


1.3 Eigene wissenschaftliche Beitrage 


Untersuchung von Verfahren zur Detektion von Positions- und kine- 
matischen Anomalien Bisherige Betrachtungen haben Verfahren zum Er- 
kennen von Positions- und kinematischen Anomalien im maritimen Raum zu- 
meist mit synthetischen Anomalien erprobt oder rein qualitative Aussagen als 
Bewertung getroffen. Hier wird daher ein Datensatz annotiert und basierend 
auf diesem werden verschiedene Verfahren zur Anomaliedetektion erprobt. 
Hierdurch können die Grenzen dieser Verfahren besser herausgearbeitet wer- 
den, um zu zeigen, dass zum Erkennen kontextueller Anomalien (oder zum 
Ausschließen von Normalverhalten) komplexere Verfahren benötigt werden. 


Erweiterung des OOWMs um ein Verhaltensmodell Das bisherige Ob- 
jektorientierte Weltmodell (OOWM) dient zur maschinellen Verarbeitung der 
Umgebung und zum Abgleich mit Hintergrundwissen zu möglichen Objekt- 
konzepten und Attributen. In dieser Arbeit wird das OOWM um Verhaltens- 
modelle erweitert. Um einen Abgleich des modellierten Verhaltens mit dem 
gezeigten Verhalten einzelner Objekte zu schaffen, wird hierbei der beobacht- 
bare Bereich der einzelnen Objekte mit betrachtet, um ein möglichst realitäts- 
nahes Verhalten darzustellen. 


Spieltheoretische Modellierung von Schiffsverhalten Basierend auf den 
theoretischen Ergänzungen zur Darstellung von Verhalten im OOWM wird 
als eine mögliche Implementation ein spieltheoretisch motiviertes Modell auf- 
gestellt. Hierbei soll insbesondere die Interaktion zwischen den einzelnen Ob- 
jekten Beachtung finden. 


Unterstützung der Generierung von Nutzenfunktionen Zur Bewertung 
von möglichen Aktionen der Objekte im OOWM können Nutzenfunktionen 
herangezogen werden. Da diese nicht immer einfach für den Menschen greif- 
bar zu modellieren sind, wird gezeigt, wie maschinelle Lernverfahren genutzt 
werden können, um Nutzenfunktionen aus vorhandenen (historischen) Da- 
ten abzuleiten. 


Deep-Learning-basierte Klassifikation von Schiffstypen Basierend auf 
einem Convolutional Neural Network (CNN) wird gezeigt, wie durch eine 
Zeitreihenbetrachtung verschiedener Attribute eines Schiffes zusammen mit 
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geographischen Merkmalen die Bestimmung von Schiffstypen durchgeführt 
werden kann. 


Verfahren zur Detektion komplexer Anomalien unter Verwendung 
unterschiedlich zuverlässiger Sensorquellen Einige Situationen von 
Interesse stellen sich als komplexe Verflechtung unterschiedlicher Faktoren 
über einen gewissen Zeithorizont dar. Um diese erfolgreich zu erkennen, 
wird gezeigt, wie ein dynamisches Bayes’sches Netz (DBN) dazu genutzt 
werden kann, unterschiedlich zuverlässige Sensorquellen miteinander zu 
verknüpfen und somit illegale Verhaltensmuster in Echtzeit zu erkennen. 


1.4 Gliederung der Arbeit 


Die vorliegende Arbeit gliedert sich wie folgt: In Kapitel 2 werden die Grund- 
lagen zu EUS, Situationsbewusstsein, Datenfusion sowie Anomaliedetektion 
vorgestellt und auf den maritimen Anwendungsbereich übertragen. 


In Abschnitt 3.1 wird das allgemeine Vorgehen zur Erreichung der Zielset- 
zung basierend auf der Forschungsstrategie Design and Create nach [Oat05] 
präsentiert. Der Abschnitt 3.2 stellt die verschiedenen in dieser Arbeit ver- 
wendeten Datensätze vor. 


Basierend auf den Iterationen aus dem Design-and-Create-Ansatz werden in 
den Kapiteln 4 bis 10 verschiedene Lösungen präsentiert, die teilweise auf- 
einander aufbauend die Forschungsfragen dieser Arbeit beantworten. Dabei 
gliedern sich diese Iterationen immer in die gleichen Teilschritte: eine Pro- 
blembeschreibung mit Zielsetzung, die verwendete Methodik, das Ergebnis 
und die daraus abgeleiteten Schlussfolgerungen. 


In Kapitel 11 wird die gesamte Arbeit zusammengefasst und es wird ein Aus- 
blick für zukünftige Arbeiten gegeben. 


2 Entscheidungsunterstiitzungs- 
systeme - Stand der Forschung und 
Technik 


»Wenn ich weiter geblickt habe, so deshalb, weil ich auf den 
Schultern von Riesen stehe.« 


— Isaac Newton 


Dieses Kapitel behandelt den Stand der Forschung und Technik für Entschei- 
dungsunterstützungssysteme (EUS) (engl. »decision support systems«) sowie 
als Teil von EUS die Themen Situationsbewusstsein, Datenfusion und Um- 
weltmodellierung. Als eine Komponente zur Verbesserung des Situationsbe- 
wusstseins innerhalb von EUS wird außerdem der Stand der Technik im Be- 
reich der maritimen Anomaliedetektion vorgestellt. Zum Abschluss wird eine 
Zusammenfassung gegeben. 


Allgemein sprechen Hansen et al. [Han19, S. 296] von einem EUS als einem 
Informationssystem, das es ermöglicht, Hypothesen in Entscheidungssitua- 
tionen zu überprüfen und so Fachleuten bei der Entscheidungsvorbereitung 
zu helfen. Ein/-e Benutzer/-in trifft hierfür Annahmen über die Zusammen- 
hänge, die zwischen den relevanten Variablen herrschen, und überprüft diese 
dann anhand der vorhandenen Datenlage. 


Laut Hansen et al. wird der Begriff EUS aber auch stärker auf solche System 
eingegrenzt, die auf Basis mathematischer Methoden und Modelle (z.B. Pro- 
gnosen, Simulationen und Optimierungen) optimale (oder zumindest für den 
Anwendungsfall ausreichend genaue) Lösungen aus möglichen Handlungs- 
alternativen ermitteln können oder neue Zusammenhänge, also bisher unbe- 
kanntes Wissen, in Datenbeständen finden können. 


2 Entscheidungsunterstützungssysteme — Stand der Forschung und Technik 


Power [Pow20] beschreibt ein EUS als ein interaktives computergestütztes 


System oder Subsystem, das Entscheidungsträgern dabei helfen soll, Proble- 


me zu identifizieren und zu lösen, Entscheidungsprozesse durchzuführen und 


schlussendlich Entscheidungen zu treffen. Ein EUS greift dafür auf Kommu- 


nikationstechnologien, Daten, Dokumente, Wissen und/oder Modelle zurück. 


Power versteht EUS als einen allgemeinen Begriff für jede Computeranwen- 


dung, welche die Fähigkeit einer Person oder Gruppe, Entscheidungen zu tref- 


fen, verbessert. Dabei unterscheidet er die folgenden fünf Arten von EUS: 


Kommunikationsgesteuertes EUS: Durch Nutzung von Netzwerk- und Kom- 


munikationstechnologien werden die Zusammenarbeit, Kommunikati- 
on und Entscheidungsfindung erleichtert. Hierbei umfassen Netzwerk- 
und Kommunikationstechnologien u.a. lokale Netzwerke oder das 
Internet. Zu den verwendeten Werkzeugen gehören virtuelle White- 
boards, Videokonferenzen und Bulletin-Boards. 


Datengesteuertes EUS: Ein System, das dem/der Benutzer/-in insbesondere 


den Zugriff auf interne und teilweise auch externe Daten - häufig in 
Form von Zeitreihen - und deren Verarbeitung ermöglicht. Als elemen- 
tarer Bestandteil dienen hier einfache Dateisysteme, um den Zugriff auf 
die Daten zu gewährleisten. Ein Data-Warehouse-System bietet neben 
dem eigentlichen Zugriff noch weitere Funktionalitäten. Den höchsten 
Grad an Funktionalität bietet die analytische Verarbeitung der Daten 
in Kombination mit der Sammlung und Verarbeitung von historischen 
Daten. Hierbei können auch Echtzeitdaten in die Analysen einfließen, 
um Betriebsleistungen u. a. zu überwachen. 


Dokumentgesteuertes EUS: Durch die Integration unterschiedlicher Speicher- 
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und Verarbeitungstechnologien wird eine vollständige Dokumentensu- 
che und -analyse ermöglicht. Beiden Dokumenten handelt es sich bspw. 
um Richtlinien, Produktspezifikationen, Kataloge und historische Un- 
ternehmensdokumente, Sitzungsprotokolle oder andere wichtige Kor- 
respondenzen. 


2.1 Situationsbewusstsein 


Wissensbasiertes EUS: Durch spezielle Problemlösungskompetenzen werden 
Empfehlungen und Vorschlage unterbreitet. Diese Kompetenzen basie- 
ren auf speziellem Domänenwissen, dem Verständnis von Problemen, 
die in dieser Domäne auftreten, sowie der Fähigkeit, Lösungsvorschlä- 
ge für einen Teil dieser Probleme generieren zu können. 


Modellgesteuertes EUS: Hier werden insbesondere quantitative mathemati- 
sche Modelle, bspw. Finanz-, Optimierungs- oder Simulationsmodelle, 
eingesetzt. In diesen Modellen werden von Experten/Expertinnen und 
Personen mit Entscheidungsbefugnis Parameter variiert und unter- 
schiedliche Daten als Ausgangslage in die Modelle gegeben, um so eine 
Entscheidungssituation zu analysieren. Es werden also insbesondere 
»Was wäre wenn?«-Szenarien erarbeitet und Sensitivitätsanalysen 
durchgeführt. In der Regel sind die Modelle nicht datenintensiv, es 
werden also keine großen Datensätze vorgehalten. 


Einsatzgebiete für EUS sind z.B. die Verbesserung von Geschäftsprozessen 
[Fel16], die Optimierung der Entscheidungsfindung in dynamischen Umge- 
bungen [Smi09] oder die Unterstützung der medizinischen Diagnose und Pfle- 
ge [Ber07]. 


Nach Paradice et al. [Par11, S. 215] ermöglicht es ein EUS, Informationen 
schnell zu prozessieren, mehrere Alternativen in Betracht zu ziehen und fle- 
xibel auf Veränderungen zu reagieren. Dabei werden Ressourcen koordiniert 
und Verhaltensmuster zur Prädiktion zukünftiger Aktionen eingelernt. Ins- 
besondere in Überwachungs- und Katastrophenszenarien gilt es hierbei das 
Situationsbewusstsein der Anwender/-innen aufrechtzuerhalten, damit Kon- 
flikte in komplexen Situationen zielführend gelöst werden können. 


2.1 Situationsbewusstsein 


Das Situationsbewusstsein fällt in der Arbeitswissenschaft in das Teilgebiet 
der Ergonomie. Ergonomie wird von Bullinger-Hoffmann und Mühlstedt wie 


folgt definiert: 
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»Die Ergonomie (von altgriech. épyov ergon, „Arbeit“, „Werk“ 
und vönog nomos, „Regel“, „Gesetz“) ist die Wissenschaft von der 
Gesetzmäßigkeit menschlicher bzw. automatisierter Arbeit. Ziel 
der Ergonomie ist es, die Arbeitsbedingungen, den Arbeitsab- 
lauf, die Anordnung der zu greifenden Gegenstände (Werkstück, 
Werkzeug, Halbzeug) räumlich und zeitlich optimiert anzuord- 
nen sowie die Arbeitsgeräte für eine Aufgabe so zu optimieren, 
dass das Arbeitsergebnis (qualitativ und wirtschaftlich) optimal 
wird und die arbeitenden Menschen möglichst wenig ermüden 
oder gar geschädigt werden, auch wenn sie die Arbeit über Jahre 
hinweg ausüben.« [Bul16, S. 399 £.] 


Gemeinsam mit anderen Definitionen (bspw. [EQU08, S. 3]) wird von Er- 
gonomie gesprochen, wenn die Zusammenarbeit von Menschen mit ande- 
ren Teilen eines Systems (z.B. Maschinen) betrachtet wird. Laut Bullinger- 
Hoffmann und Mühlstedt [Bul16, S. 9] werden neben den beiden Hauptrich- 
tungen Produkt- und Prozessergonomie noch weitere Unterdisziplinen un- 
terschieden. Eine dieser Unterdisziplinen ist die kognitive Ergonomie. Diese 
behandelt das menschliche Verhalten und die Informationsverarbeitung. 


Ein wichtiges Konzept in diesem Zusammenhang ist das Situationsbewusst- 
sein (engl. »situation awareness«). In vielen unterschiedlichen Anwen- 
dungsdomänen wurde das Situationsbewusstsein von Menschen betrachtet, 
dazu zählen unter anderem Piloten/Pilotinnen in der Luftfahrt [End98], 
die Leitwarte von Energieübertragungsnetzen [End08], Fahrerassistenzsys- 
teme für das autonome Fahren [Lie16], die Mensch-Roboter-Kooperation 
[Pul15], Cybersecurity [Jaj17], Krisenmanagement nach Naturkatastro- 
phen [Shi20], Aufspüren von Grippeausbrüchen [Gro19], Aufgaben in der 
Anästhesie [Sch13] und der Akutmedizin [Pie08] oder Unterstützung von 
Offshorebohrungen [Sne06, Sne13]. In diesen Anwendungsfällen geht es 
abstrahiert immer darum, dass Menschen Entscheidungen fällen sollen und 
dafür verschiedene Informationen verarbeiten müssen, was wiederum ein 
gutes Situationsbewusstsein voraussetzt. 


Eine weithin geläufige Definition des Situationsbewusstseins wurde von End- 
sley nach [End95b] basierend auf den Ergebnissen aus [End87] aufgestellt: 
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2.1 Situationsbewusstsein 


»Situation awareness is the perception of the elements in the 
environment within a volume of time and space, the comprehen- 
sion of their meaning, and the projection of their status in the 
near future.« [End88, S. 792] 


Diese Definition beschreibt Situationsbewusstsein als Modell eines mentalen 
Zustands. Dieser Zustand wird als Grundlage fiir Entscheidungen genutzt. 
Der Prozess zum Erreichen oder Aufrechterhalten von Situationsbewusstsein 
gliedert sich in die drei Teile »Wahrnehmung«, »Verstehen« und »Projekti- 
on«. Der gesamte Zyklus ist in Abbildung 2.1 dargestellt. 


Nach Endsley [End95b] ist der erste Schritt zum Erreichen von Situations- 
bewusstsein das Wahrnehmen des Zustands, der Attribute sowie der Dyna- 
mik aller relevanten Elemente in der Umgebung. In einem maritimen Anwen- 
dungsszenario sind dies z. B. Schiffe mit ihren Attributen (bspw. Position oder 
Geschwindigkeit) oder bathymetrische Informationen. 


Der zweite Schritt beschreibt das Verstehen der gegenwärtigen Situation. Das 
Verstehen gründet auf den Informationen aus der Wahrnehmung der Um- 
welt. Dabei ist es wichtig, dass diese Elemente nicht nur einfach vorhan- 
den sind, sondern in Hinblick auf die Aufgabenstellung verstanden werden. 
Anwender/-innen werden hier also ein holistisches Bild der Umgebung erstel- 
len, indem die Wichtigkeit von Objekten und Ereignissen bewertet werden. 


Das Projizieren der zukünftigen Aktionen und die Auswirkung auf die Um- 
welt beschreibt die höchste Ebene des Situationsbewusstseins. Hierfür wer- 
den die Ergebnisse der ersten beiden Ebenen verwendet, um basierend auf 
dem Wissen um den Zustand und die Dynamik der Elemente sowie auf dem 


Zustand der 
Umwelt 


Y 


Situationsbewusstsein 
Level 1 Level 2 Level 3 Entscheidung l Handlung 
Wahrnehmung Verstehen Projektion 


Abbildung 2.1: Modell des Situationsbewusstseins nach [End95b] 


Auswirkung 
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Verstandnis der Situation eine Pradiktion fiir einen (zumindest kurzen) Zeit- 
horizont durchführen zu können. 


Das Treffen von Entscheidungen hat nach Endsley [End95b] als einen maß- 
geblichen Eingang das Situationsbewusstsein, das durch die drei Ebenen be- 
schrieben wird. Es findet also eine Entkopplung der Entscheidung und Durch- 
führung einer Aktion einerseits und des Situationsbewusstseins andererseits 
statt. 


Verfahren zur Messung von Situationsbewusstsein werden nach Fracker in 
drei Kategorien eingeteilt [Fra91]: subjektive, explizite und implizite Me- 
thoden. Subjektive Methoden basieren auf persönlichen Einschätzungen der 
Anwender/-innen selbst oder einer beobachtenden Person. Eine bekannte 
subjektive Messmethode stellt SART [Tay90] dar. Bei expliziten Methoden 
werden Informationen von der Testperson aus dem Gedächtnis entweder 
während oder nach der Aufgabe abgerufen. SAGAT [End95a] ist eine der 
bekanntesten Methoden dieser Kategorie. Implizite Messmethoden schauen 
auf die Qualität der Ausführung einer Aufgabe, um so Rückschlüsse auf das 
Situationsbewusstsein zu geben. Diese Methoden werden daher auch als 
leistungsbezogene Messmethoden bezeichnet. Dabei ist zu bedenken, dass 
ein gutes Situationsbewusstsein nur die Wahrscheinlichkeit für eine gute 
Ausführung einer Aufgabe erhöht [End00]. 


In [End95b] geht Endsley außerdem auf unterschiedliche Faktoren ein, die das 
Situationsbewusstsein beeinflussen. Dazu gehören die Fähigkeiten, Erfahrun- 
gen und das jeweils durchlaufene Training eines Menschen. Weitere Faktoren 
bilden die eigenen Ziele, Meinungen und Erwartungshaltungen. Einen Ein- 
fluss auf das erreichbare Situationsbewusstsein kann auch das Systemdesign 
haben. Zum Systemdesign gehören die Funktionen des Systems, die Benut- 
zerschnittstelle, die Komplexität des Systems, der Automatisierungsgrad und 
die Arbeitsbelastung. 
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2.2 Entscheidungsunterstützung für den 
maritimen Raum 


Für Küstenwachen, Seenotrettungsdienste, Strafverfolgungsbehörden und 
andere zivile oder nicht zivile Organisationen gibt es ein großes Interesse, 
Seegebiete zu beobachten und unter bestimmten Gegebenheiten einzugrei- 
fen. Im Allgemeinen stehen hierzu unterschiedliche EUS zur Verfügung. Ein 
wichtiger Punkt hierbei ist, einem/einer Anwender/-in ein möglichst gutes 
Situationsbewusstsein zu vermitteln. 


In maritimen Überwachungsszenarien wird das Thema des Situations- 
bewusstseins als »Maritime Domain Awareness« (MDA) [IMO12] oder 
»Maritime Situational Awareness« [Eur09] bezeichnet. Unter dem Begriff 
MDA versteht die International Maritime Organization (IMO) 


»The effective understanding of any activity associated with 
the maritime environment that could impact upon the security, 
safety, economy or environment.« [IMO12, S. 11] 


Die Europäische Kommission definiert den Begriff des maritimen Situations- 
bewusstseins wie folgt: 


»Maritimes Situationsbewusstsein ist die genaue Wahrneh- 
mung und korrekte Einschätzung des Risikopotenzials aller 
Tätigkeiten im maritimen Bereich, die die Sicherheit, die Wirt- 
schaft oder die Umwelt der Europäischen Union und ihrer 
Mitgliedstaaten beeinflussen können.« [Eur09, S. 2] 


In beiden Definitionen geht es also darum, die Umwelt wahrzunehmen, die In- 
halte und die Aktivitäten der Akteure zu verstehen und im Falle von Gefahren- 
situationen diese korrekt bewerten zu können. Ein Hilfsmittel, um maritimes 
Situationsbewusstsein zu erlangen, ist das sogenannte Recognized Maritime 
Picture (RMP): 


»The composite unambiguous and validated picture of ac- 
tivities over a maritime area of interest showing validated info 
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from data sources, vessel characteristics, vessel kinematics, ves- 
sel tracks, vessel identification and classification results. The 
construction of an RMP consists of detecting objects of interest 
(ships), classifying them, assessing what they are doing, and 
deciding whether any type of follow-on action is required.« 
[Lan17, S. 9] 


Das RMP dient also dazu, die vorhandenen Informationen zusammenzutra- 
gen und darzustellen, um darauf aufbauend weitere Aktionen durchführen 
zu können. Auch wenn in der Definition auf validierte Informationen einge- 
grenzt wird, so wird dieser Begriff in der weitläufigen Literatur häufig we- 
niger scharf abgegrenzt, sodass auch nicht validierte Informationen mit auf- 
genommen werden. Dabei werden auch Informationen, die ein Schiff selbst 
ohne weitere Verifikation preisgibt, direkt in das RMP integriert. Im Folgen- 
den werden verschiedene Sensoren und Systeme vorgestellt, die als Grundlage 
zum Aufbauen eines RMP dienen können oder selbst direkt ein EUS darstellen. 


2.2.1 Eingesetzte Sensoren und Systeme zur 
Datenerfassung 


In maritimen EUS wird eine Vielzahl an unterschiedlichen Systemen zur Da- 
tenerfassung eingesetzt, dazu zählen Radio-Detection and Ranging (Radar), 
optronische Systeme sowie Informationsquellen, die über unterschiedliche 
Funksysteme Auskunft über den Schiffsverkehr geben. Die Sensoren befin- 
den sich auf Schiffen, an Land oder auf Satelliten bzw. die Systeme werden 
über terrestrische Empfänger oder über Satelliten für die weitere Verarbei- 
tung bereitgestellt. 


2.2.1.1 Radar - Radio-Detection and Ranging 
Radarsysteme werden in der maritimen Anwendungsdomäne sowohl zur Na- 


vigation [Hen20c] als auch zur Überwachung [Tha20a, Hen20b, Ray20] ver- 
wendet. In beiden Fällen nutzen die eingesetzten Systeme Frequenzen aus dem 
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X- (Frequenz 8-12 GHz, Wellenlänge 3,75-2,5 cm) oder S-Band (Frequenz 2- 
4 GHz, Wellenlänge 15-7,5 cm). Letzteres Frequenzband wird verwendet, um 
eine bessere Detektion von Schiffen bei rauer See zu ermöglichen. 


Die Detektionswahrscheinlichkeit hängt bei den Systemen zum einen vom 
eingesetzten Frequenzband, zum anderen aber auch von den Eigenschaften 
des zu detektierenden Objekts ab. Insbesondere der Radarquerschnitt ist von 
großer Bedeutung. Bei Einsatz eines typischen Systems [Hen20b] kann ein 
Schwimmer mit einem Radarquerschnitt von ca. 0,1 m? in 1km Entfernung 
detektiert werden, ein kleines Boot oder ein Jetski bei einem Radarquerschnitt 
von ca. 1,5 m?in 20km und ein Schiff mit einem Radarquerschnitt von ca. 100 
m? in 40km Entfernung. 


2.2.1.2 Optronische Systeme 


Neben Radarsystemen werden auch optronische Systeme [Tha20b, Hen20a] 
verwendet. Diese dienen häufig zur weiteren Identifikation der Schiffe, bspw. 
anhand des am Bug befindlichen Schiffsnamens oder der erkennbaren Auf- 
bauten. Neben Kamerasystemen im sichtbaren Bereich werden die Systeme 
zusätzlich mit elektrooptischen Entfernungsmessern und Infrarotsensoren 
ausgestattet. Um die Anwender/-innen zu entlasten, werden die Systeme mit 
Verfahren zur Objekterkennung und -verfolgung bspw. zur automatischen 
Nachführung der Kamera ausgestattet. 


2.2.1.3 AIS - Automatic Identification System 


Das Automatic Identification System (AIS) [IMO20a] wurde zur Kollisions- 
verhütung auf See entwickelt. Die Grundidee liegt darin, automatisch Infor- 
mationen über ein Schiff an andere Schiffe in der Nähe sowie an Behörden 
zu übermitteln. 


In der International Convention for the Safety of Life at Sea (SOLAS) [IMO14] 
wird in Kapitel 5 Regel 19 »An Bord mitzuführende Navigationssysteme und 
Ausrüstung« [Bun02] festgelegt, dass Empfänger und Sender für AIS auf 
Schiffen installiert sein müssen, wenn es sich um Fahrgastschiffe handelt oder 
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diese auf internationalen Fahrten eine Bruttoraumzahl von 300 tiberschreiten 
(fiir Frachtschiffe auf nationalen Fahrten gilt als Grenze eine Bruttoraumzahl 
von 500). Weitere Vorgaben zur Ausriistung von AIS wurden bspw. durch das 
US. Coast Guard Navigation Center [US 20] oder das Europäische Parlament 
und den Rat der Europäischen Union [Eur02] herausgegeben. 


Das AIS muss laut SOLAS dabei folgende Aufgaben erfüllen: 


e »selbsttätig an entsprechend ausgerüstete Landstationen, Schiffe und 
Luftfahrzeuge bestimmte Angaben liefern, insbesondere zu Identität 
des Schiffes, Typ, Position, Kurs, Geschwindigkeit und 
Navigationszustand sowie weitere sicherheitsbezogene Angaben; 


« selbsttätig solche Angaben von ähnlich ausgerüsteten Schiffen 
empfangen; 


e Schiffe überwachen und ihre Bahn verfolgen; 
e mit landgestützten Einrichtungen Daten austauschen« [Bun02, S. 17]. 


In Tabelle 2.1 ist eine Übersicht der schiffsspezifischen Daten gegeben, die 
durch das AIS übertragen werden. Es werden hier statische, dynamische und 
reisespezifische Daten unterschieden. Neben eindeutigen Identifikations- 
merkmalen, wie der MMSI und der IMO-Nummer, enthalten die statischen 
Informationen noch einen Schiffstyp sowie die Länge und Breite des Schiffs. 
Zu den dynamischen Daten zählen insbesondere Position, Kurs, Geschwin- 
digkeit und der Navigationsstatus. Für Letzteren werden nach [IMO15, S. 
6] Werte vorgegeben (z.B. »In Fahrt« (engl. »underway by engines«) oder 
»Vor Anker« (engl. »at anchor«)). 


Als reisespezifische Daten werden der Tiefgang, das Ziel mit geschätzter An- 
kunft sowie die Gefahrgutklasse der Ladung angesehen. Die unterschiedli- 
chen Informationen werden in definierten Intervallen übertragen. Für die sta- 
tischen und reisespezifischen Daten gilt ein Intervall von 6 Minuten. Für die 
dynamischen Daten gelten die Intervalle aus Tabelle 2.2. 
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Da die Informationen des AIS in vielen Fällen händisch eingegeben werden 
und es keine Verifikation der Übertragung gibt, ist eine Manipulation der Da- 
ten nicht ausgeschlossen. Laut einer Studie [Har07], in der Fehlerarten in 
AIS-Daten untersucht wurden, enthalten 1% der Daten fehlerhafte Positio- 
nen (z.B. Breitengrad größer 90° oder Längengrad größer 180°), 2% Fehler 
in der MMSI, 30 % einen fehlerhaften Navigationsstatus und 74% ungenaue 
Schiffstypen. Weitere Studien zur Integrität der AIS-Daten wurden bspw. in 
[Fel13, Fel15] vorgestellt. In diesen wird insbesondere auf die Problematik feh- 
lerhafter Kurs- und Kursänderungsinformation bei der Kollisionsverhütung 
eingegangen. 


Laut [Iph16] gibt es drei hauptsächliche Arten von Fehlern in den Daten: feh- 
lerhafte Daten, die nicht absichtlich gesendet werden, Verfälschungen, die 


Tabelle 2.1: Inhalte der schiffsspezifischen AIS-Nachrichten nach [IMO15, S. 5 f.] 


Maritime Mobile Service Identity (MMSI) 
Rufzeichen und Name 

IMO-Nummer 

Länge und Breite in Metern 

Schiffstyp 


Position der Antenne 


Statisch 


Position als Breiten- und Längengrad 
Indikator der Positionsgenauigkeit 
Zeitstempel in koordinierter Weltzeit (UTC) 
. Kurs über Grund in Grad 
Dynamisch Orientierung in Grad 
Geschwindigkeit über Grund in Knoten 
Kursänderungsrate in Grad pro Minute 


Navigationsstatus 


Tiefgang 

Gefahrgutklasse der Ladung 

Ziel und geschätzte Ankunftszeit 
Wegpunkte der Route 


Reisespezifisch 
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absichtlich gesendet werden, und Täuschungsversuche durch Dritte. Unbe- 
absichtigte falsche Daten können z.B. durch Probleme mit der Sendeeinrich- 
tung, Fehler in externen Sensoren (Position durch das Global Navigation Sa- 
tellite System (GNSS)) oder eine fehlerhafte manuelle Eingabe (z.B. Recht- 
schreibfehler) entstehen. 


Verfälschte Daten, die absichtlich versendet werden, sollen Aktivitäten ver- 
schleiern oder andere in die Irre führen. Dies kann unter anderem eine falsche 
Identität [The12, Vas18], das Verschwinden des eigenen Schiffes [The19] oder 
die Angabe falscher Positionen oder Aktivitäten sein [Kat13]. 


Durch das Erzeugen eines nicht vorhandenen Schiffes oder das Verschleiern 
der Identität eines Schiffes kann ein Dritter falsche Positionen verschicken, 
damit das Verhalten eines Schiffes legitim aussieht [Bal14, Kon18]. 


Auch wenn das Maritime Safety Committee in seiner 79. Sitzung [IMO20a] 
übereingekommen ist, dass eine Veröffentlichung der frei verfügbaren durch 
Schiffe generierten AIS-Daten die Sicherheit von Schiffen und Häfen gefähr- 
den kann, werden diese Daten trotzdem durch verschiedene Plattformen wie 
»Marine Traffic«’, »Vessel Finder«? oder »AISHub«° bereitgestellt. 


Tabelle 2.2: Übertragungsintervalle der dynamischen AIS-Nachrichten für »Class A« Transcei- 
ver nach [IMO15, S. 7] 


Schiffsstatus Intervall 
Vor Anker / festgemacht und <3 kn 180s 
Vor Anker / festgemacht und >3 kn 10s 
0-14kn 10s 
0-14 kn und Kursänderung 31/3s 
14-23 kn 6s 
14-23 kn und Kursänderung 2s 
>23 kn 2s 
>23 kn und Kursänderung 2s 


* https://www.marinetraffic.com/, letzter Abruf am 04.03.2020. 
2 https://www.vesselfinder.com/, letzter Abruf am 04.03.2020. 
> https://www.aishub.net/, letzter Abruf am 04.03.2020. 
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2.2.1.4 LRIT - Long-Range Identification and Tracking 


Das System Long-Range Identification and Tracking (LRIT) [IMO20b, deu13] 
dient zur globalen Identifikation und Routenverfolgung von Schiffen. Die SO- 
LAS [IMO14] beschreibt in Kapitel 19 Regel 1 die Rechte und Verpflichtungen 
der Behörden und Rettungsdienste, um Informationen über dieses System zu 
erhalten. 


Alle berechtigten Entitäten können die LRIT-Informationen der nationalen, 
regionalen und kooperierenden LRIT-Datenzentren durch Anfragen an das 
International LRIT Data Exchange erhalten. Dabei soll jede Administration ei- 
ne Liste der Schiffe unter eigener Flagge, die Auskunft über das LRIT-System 
geben müssen, zusammen mit weiteren Informationen an ein selbstgewähltes 
LRIT-Datenzentrum übertragen. Die jeweilige Administration hat die Aufga- 
be, diese Liste aktuell zu halten. Schiffe sollen ihre Informationen nur dem 
LRIT-Datenzentrum mitteilen, das durch ihre jeweilige Administration aus- 
gesucht wurde. 


Die LRIT-Ausrüstung ist dabei für alle Fahrgastschiffe sowie für Fracht- und 
sonstige Schiffe mit einer Bruttoraumzahl größer 300 aufinternationaler Fahrt 
erforderlich. Sie dient dazu, die Identität sowie die Position des Schiffes mit 
Zeitstempel zu übertragen. 


2.2.1.5 VMS - Vessel Monitoring System 


Zur Überwachung der Fischerei wird das Vessel Monitoring System (VMS) 
[Eur20a] eingesetzt. Dieses satellitengestützte System überträgt in regelmäßi- 
gen Abständen Informationen über Position, Kurs und Geschwindigkeit der 
überwachten Fischerboote an die jeweiligen Behörden. 


VMS wurde als Erstes von der EU als verpflichtend für größere Schiffe vorge- 
schrieben. Heutzutage wird das System aber weltweit zur Überwachung und 
Kontrolle von Fischerei eingesetzt. Die EU-Rechtsprechung sieht vor, dass al- 
le Küstenmitgliedsländer der EU ein mit den übrigen VMS kompatibles VMS 
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aufsetzen müssen. Mit diesem können die Länder ihre Informationen mitein- 
ander teilen und die EU-Kommission kann das Einhalten der Regeln und Ge- 
setze überwachen. 


2.2.2 Entscheidungsunterstützungssysteme auf 


Schiffsbrücken 


Zur Unterstützung der Schiffsbesatzung wurden verschiedene Systeme ein- 
geführt. Diese sollen vorhandene Informationen aus den unterschiedlichen 
Quellen sinnvoll aufbereiten und so der Entscheidungsunterstützung dienen. 


2.2.2.1 ARPA - Automatic Radar Plotting Aid 


Eine Anlage des Systems Automatic Radar Plotting Aid (ARPA) dient zur Vi- 
sualisierung von Radar-Plots. Dafür werden neben dem Radar noch zusätz- 
lich der Kreiselkompass und die Fahrtmessanlage ausgewertet. Dabei sollen 
Schiffe in der Umgebung automatisch verfolgt und zusammen mit Zusatz- 
informationen wie Kurs, Geschwindigkeit und Passierabstand (engl. »closest 
approach«) angezeigt werden. Technische Spezifikationen wurden 1979 als 
Resolution der Vollversammlung A. 422 (XI) der IMO angenommen [IMO79]. 
Die ARPA-Anlage unterstützt bei der Schiffsführung und kann so einen Bei- 
trag zur Erhöhung der Sicherheit auf See liefern. 


2.2.2.2 ECDIS - Electronic Chart Display and Information System 


Bei dem Electronic Chart Display and Information System (ECDIS) handelt es 
sich um ein Navigationsinformationssystem. Es dient dazu, unterschiedliche 
Datenquellen aufzubereiten und für die Navigation darzustellen. Die genauen 
Anforderungen an ein ECDIS werden durch die IMO definiert [IMO96]. Es 
erfüllt dabei die Anforderungen der IMO als alternatives Navigationsmittel 
zu Navigationskarten auf Papier. 


Zu den dargestellten Informationen gehören Position, Kurs und Geschwin- 
digkeit des eigenen Fahrzeugs sowie anderer Fahrzeuge in der Umgebung 
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über Radar, AIS oder Echolot und die Darstellung von Electronic Navigatio- 
nal Charts (ENCs) (elektronische Navigationskarten). Zusätzlich kann hier- 
bei auf weitere Informationen zu den dargestellten Objekten zurückgegriffen 
werden. Dies beinhaltet bspw. Teile der Seehandbücher und des Leuchtfeuer- 
verzeichnisses. Außerdem kann das ECDIS Warnmeldungen erzeugen, indem 
Informationen zum Tiefgang sowie zur Position und Fahrt mit den anderen 
Quellen verknüpft werden. Hiermit kann der Gefährdung durch seichte Ge- 
wässer oder Sperrzonen entgegengewirkt werden. 


2.2.3 Entscheidungsunterstützungssysteme an Land 


Neben den Unterstützungssystemen direkt an Bord der Schiffe gibt es unter- 
schiedliche Systeme, die Küstenwachen und andere Behörden an Land bei 
ihren Aufgaben unterstützen sollen. So hat die European Maritime Safety 
Agency (EMSA) bspw. verschiedene Systeme eingerichtet, um den Mitglieds- 
ländern der EU Hilfsmittel an die Hand zu geben, mit denen sie Umweltver- 
schmutzungen oder illegale Aktivitäten besser erkennen können. 


2.2.3.1 VTS - Vessel Traffic Service 


Bei dem Vessel Traffic Service (VTS) [IMO20c] handelt es sich um ein 
landseitiges System, das bei der Verwaltung des Schiffsverkehrs in Häfen 
und auf Wasserstraßen unterstützen soll. Dabei sind die zugrundeliegenden 
Fähigkeiten sehr unterschiedlich ausgestaltet. Diese reichen von der ein- 
fachen Anzeige der Position der Schiffe und anderer Verkehrsteilnehmer 
über die Darstellung von wetterbedingten Gefährdungspotentialen bis zu 
umfassenden Unterstützungswerkzeugen zur Verwaltung des Verkehrs. Das 
kommerziell erhältliche VTS-System STYRIS VTS [Air18] bspw. besitzt ein 
System zum Erkennen von bestimmten Regeln über vordefinierte Gebiete 
(Schiff fährt in oder aus Gebiet, mögliche Kollision mit stationären Hinder- 
nissen oder Überprüfung des zulässigen Tiefgangs) oder zu ausgewählten 
Schiffen (Vergleich mit Referenzroute, mögliche Kollision mit anderen Schif- 
fen oder Position beim Ankern außerhalb des Schwojekreises). 
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Nach der SOLAS [IMO14] Kapitel V können Staaten ein VTS einrichten, wenn 
diese der Meinung sind, dass die Verkehrsdichte bzw. das Gefährdungspoten- 
tial dies rechtfertigt. 


Beim Eindringen in ein VTS-Gebiet melden sich Schiffe im Normalfall bei 
den jeweiligen Behörden und können von den VTS-Kontrollzentren nachver- 
folgt werden. Innerhalb des Gebiets sind Schiffe dazu angehalten, spezifische 
Frequenzen im Auge zu behalten, da sie darüber Navigationsmeldungen und 
Warnungen erhalten können. Außerdem können VTS-Operator/-innen das 
Schiff bei einem Vorfall oder bei Verkehrsflussregulierungen direkt kontak- 
tieren. 


Im Juli 1948 wurde ein Überwachungsradar in Liverpool, England, eingerich- 
tet. Dies war der erste Hafen der Welt, in dem dies erfolgte. Zusammen mit der 
Möglichkeit, über Funk Kontakt mit den überwachten Schiffen aufzunehmen, 
um so Nachrichten auszutauschen, stellt dies formal auch das erste VTS dar. 


Die IMO erkannte 1968 in der Resolution A.158 (ES.IV) die Wichtigkeit eines 
VTS für die sichere Navigation zu See an. Durch immer bessere Technologien 
und Fortschritte in der Ausrüstung zur Schiffsverkehrsüberwachung mussten 
klare Richtlinien zum Einsatz eines VTS geschaffen werden. Insbesondere sah 
man die Gefahr, dass Schiffsführende in ihrer Verantwortung, das Schiff zu 
navigieren, eingeschränkt werden. Deshalb wurde 1985 in der Resolution A.578 
(14) von der IMO die Richtlinie zum Einsatz eines VTS verabschiedet. 


2.2.3.2 EMSA CleanSeaNet 


Mit dem CleanSeaNet hat die EMSA ein satellitenbasiertes System zur Detek- 
tion von Olteppichen und involvierten Schiffen fiir die Mitgliedstaaten der EU 
bereitgestellt [Eur20c]. Das System unterstiitzt bei der Detektion und Nach- 
verfolgung von Olverschmutzungen auf der Wasseroberfläche sowie bei der 
Überwachung von Umweltverschmutzungen in Notfallsituationen und bietet 
Unterstützung zur Identifikation der Verursacher. 


Das CleanSeaNet verwendet dazu Satellitenbilder, die durch ein Synthetic 
Aperture Radar (SAR) aufgenommen werden. Dies ermöglicht eine weltweite 
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Abdeckung maritimer Gebiete bei Tag und Nacht und unabhängig von Nebel 
oder Bewölkung. Diese Bilder werden bezüglich Ölverschmutzung, Schiffsak- 
tivitäten und meteorologischer Variablen ausgewertet. Dadurch stehen unter 
anderem folgende Informationen zur Verfügung: 


« Position und Ausmaße des Ölteppichs 
e Informationen zur Konfidenz der Detektion 
e Details zu möglichen Verursachern 


e Zusätzliche optische Satellitenbilder zur weiteren (ggf. manuellen) 
Auswertung 


Für den Dienst wird in Abstimmung mit den Anforderungen der Endanwen- 
der/-innen die Abdeckung der Satellitenbilder geplant. Die Bilder werden 
dann zusammen mit weiteren Informationen (z.B. meteorologische, ozea- 
nografische und zur Schiffsdetektion ergänzende Informationen wie AIS) 
von erfahrenen Fachleuten bewertet, um mögliche Verschmutzungen und 
deren Wahrscheinlichkeit zu erkennen sowie die Quellen der Verschmutzung 
ausfindig zu machen. 


Sollte eine mögliche Verschmutzung erkannt werden, so werden die betroffe- 
nen Länder direkt informiert. Den nationalen Behörden werden die relevanten 
Bilder zur Verfügung gestellt, um darauf aufbauend Warnmeldungen verfas- 
sen zu können. Die Fähigkeit, die nötigen Informationen nahezu in Echtzeit 
bereitzustellen, ermöglicht es den Küstenstaaten, geeignete Gegenmaßnah- 
men zeitnah einzuleiten und den Verursacher zur Rechenschaft zu ziehen. Zur 
weiteren Unterstützung werden zusätzliche Satellitenbilder angeboten. 


2.2.3.3 EMSA SafeSeaNet 


Um allgemein die Sicherheit im maritimen Raum, den Schutz und die Siche- 
rung von Häfen, den Schutz der Meeresumwelt und die Effizienz des mari- 
timen Verkehrs und Transports zu erhöhen, hat die EMSA das SafeSeaNet 
[Eur20e] als ein Schiffsverkehrsüberwachungs- und Informationssystem ein- 


geführt. 
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Ziel des SafeSeaNet ist es, ein Netzwerk zum Datenaustausch zwischen den 


maritimen Behörden in der EU, in Norwegen und Island aufzubauen. Die 


wichtigsten übertragenen Informationen sind die folgenden: 


Schiffsposition und andere Informationen über AIS 
Historische Schiffspositionen 
Geschätzte Ankunfts- und Abfahrtszeiten 


Sicherheitsrelevante Informationen, z.B. Details zu geladenen 
Gefahrengütern 


Reports zu vergangenen sicherheitsrelevanten Vorfällen oder 
Umweltverschmutzungen durch Schiffe 


Details zu Abfällen an Bord 
Position der übrigen einwandigen Tanker‘ 
Liste an Schiffen, die EU-Häfen nicht anlaufen dürfen 


ENCs mit Informationen zur Tiefe, zu Verkehrstrennungsgebieten etc. 


Eine zusätzliche Komponente besteht in dem automatischen Erkennen von 


bestimmtem Schiffsverhalten (engl. »automated behaviour monitoring«) 


[Eur18]. Hierbei werden unter anderem Daten aus den Systemen LRIT, AIS 


und VMS zusammengeführt. Neben anderen Fähigkeiten ist das System dazu 


in der Lage, folgende Verhaltensmuster zu erkennen: 


Ankerplatz außerhalb eines Hafens 
Treibende Schiffe 

Rendezvous zweier Schiffe 
Manipulation der Positionsangabe 


Fährt (zu einer bestimmten Zeit) in oder aus einem Gebiet 


* Nach der Verordnung (EU) Nr. 530/2012 des Europäischen Parlaments und des Rates. wird der 
Transport von Schweröl durch einwandige Tanker von oder nach Häfen der EU-Mitgliedstaaten 
verboten. 
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e Lückenhafte Selbstauskunft 
« Spontane Kurs- oder Geschwindigkeitsänderung 
e Steuert auf Küste zu oder von Küste weg 


« Geringer Abstand zur Küste 


Diese Verhaltensmuster können in Form von Regeln miteinander verknüpft 
werden, um automatische Alarme zu generieren. 


2.2.4 Relevante Standards und Interoperabilität 


Durch die große Menge an Stakeholdern wurde eine große Anzahl an Stan- 
dards entwickelt und es wurden Projekte gestartet, um einen Austausch von 
Daten und Informationen zu ermöglichen. Hier wird daher nur eine Auswahl 
der relevanten Standards präsentiert. Zunächst gilt es eine allgemeine Unter- 
scheidung zwischen den im militärischen Bereich gängigen Methoden und 
den zivilen zu treffen. Zu den militärischen Standards zur Interoperabilität 
zählen insbesondere sogenannte Standardization Agreements (STANAGs), die 
durch die NATO-Mitgliedstaaten verabschiedet werden. Dazu zählen bspw. 
die STANAG 4607 [NAT10] für die Übertragung von Detektionen basierend 
auf z.B. Radarsystemen oder die STANAG 4676 [NAT14] zum Thema Objekt- 
verfolgung. 


Im zivilen Bereich gibt es z.B. das Inter-VTS Exchange Format (IVEF) [IAL11] 
zum Austausch von Informationen zwischen VTS. Des Weiteren gibt es einige 
Bestrebungen im EU-Rahmen, Daten und Informationen zwischen Behörden 
und Mitgliedstaaten auszutauschen. Dazu zählen bspw. die beiden Projekte 
MARSUR und EUCISE2020, die im Folgenden weiter beschrieben werden. 


MARSUR - Maritime Surveillance 
Das Projekt Maritime Surveillance (MARSUR) [Eur12] wurde im September 


2006 durch die European Defence Agency (EDA) gestartet. Es soll ein Netz- 
werk aufbauen, indem existierende Lösungen für den Austausch von Daten im 
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maritimen Raum genutzt werden sollen. Dieser Austausch soll zwischen den 
Marinen der teilnehmenden Mitgliedstaaten sowie verschiedenen EU-Behör- 
den stattfinden. Dabei soll Doppelarbeit vermieden und auf den Einsatz be- 
stehender Technologien, Daten und Informationen gesetzt werden. Dies soll 
insgesamt zu einer effizienten und kostengünstigen Zusammenarbeit führen, 
die allgemein die Sicherheit auf See erhöhen soll. 


Seit Beginn des Projekts schließen sich weitere Mitgliedstaaten den Bestre- 
bungen an, den Informationsaustausch untereinander durch das MARSUR- 
Netzwerk zu verbessern. Dabei werden weitere Projekte und Initiativen 
gestartet, um die Funktionalitäten und den Grad der Vertraulichkeit des 
MARSUR-Netzwerkes zu verbessern und mögliche neue, von den Mitglied- 
staaten vorgeschlagene Anforderungen zu berücksichtigen. Dies geschieht 
insbesondere unter der Beachtung der nötigen technischen Elemente, um 
die Nutzung in einem voll funktionsfähigen Kontext zu gewährleisten. Eine 
bestehende Herausforderung ist hier die Etablierung eines gemeinsamen 
Datenmodells und einer einheitlichen Datensemantik, um so den Austausch 
zwischen den verschiedenen Systemen zu erleichtern. 


EUCISE2020 - European test bed for the maritime Common 
Information Sharing Environment in the 2020 perspective 


Die Initiative CISE beschreibt einen gemeinsamen Informationsraum für 
maritime Behörden der EU-Mitgliedstaaten [Tho19]. Die Entwicklung wurde 
2009 vorgestellt und seitdem verfeinert und vorangetrieben. Vorgängerpro- 
jekte sind unter anderem BlueMassMed [Blu12] und MARSUNO [MAR11]. 


Die zugrundeliegende Architektur soll es den an der maritimen Überwachung 
interessierten oder aktiv beteiligten Behörden ermöglichen, Informationen 
und Daten auszutauschen. Zurzeit werden in vielen Fällen von unterschied- 
lichen EU- und Mitgliedstaatsbehörden Daten zu Grenzschutz, Fischereikon- 
trolle, Sicherheit auf See, Umweltschutz, Zoll etc. separat aufgezeichnet und 
nicht miteinander geteilt [Eur20b]. Der Austausch solcher Informationen 
kann solche Prozesse effizienter und kostengünstiger gestalten, da hierbei 
Synergien ausgenutzt werden können. 
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Die Initiative weist dabei folgende Charakteristika auf: 


e Ein freiwilliger Kooperationsprozess, um den Austausch relevanter 
Informationen zu verbessern 


+ Ein dezentraler Rahmen zum Austausch der Daten 


« Ein zu bestehenden Systemen und Diensten komplementärer Ansatz, 
um einen Mehrwert zu erbringen und dabei Dopplungen zu vermeiden 


e Vermeidung von Anpassungen der administrativen Strukturen der 
Mitgliedstaaten sowie der EU-Legislatur 


Im 7. Forschungsrahmenprogramm (FP7) der EU wurde 2014 das Projekt »Eu- 
ropean test bed for the maritime Common Information Sharing Environment 
in the 2020 perspective« (EUCISE2020) gestartet, mit dem Ziel die Entwick- 
lung eines voroperationellen Netzwerks für den Informationsaustausch auf- 
zubauen [Eur20d]. Dieses Netzwerk sollte der erste Schritt auf dem Weg zu 
einem voll funktionsfähigen Informationsraum CISE sein. Das Projekt wurde 
im März 2019 abgeschlossen. 


Im Rahmen von EUCISE2020 wurde ein Datenmodell [EUC16] entwickelt. 
Dieses wird durch die EMSA weiter betreut [DG 17]. Es ermöglicht, wichtige 
Entitäten für EUS im maritimen Raum abzubilden. Innerhalb weiterer För- 
derungen, z.B. Maritime Integrated Surveillance Awareness (MARISA)’, ein 
Projekt gefordert durch das EU-Rahmenprogramm fir Forschung und Inno- 
vation Horizont 2020, wurden Ergänzungen zu diesem Modell durchgeführt, 
um bspw. insbesondere Anomalien besser abbilden zu können. 


S-100 - IHO Universal Hydrographic Data Model 


Um die Interoperabilität zwischen digitalen Systemen zu verbessern, wird 
durch die International Hydrographic Organization (IHO) das Datenmodell 
S-100 [IHO18] eingeführt, das zur Entwicklung von digitalen Produkten 


° https://www.marisaproject.eu/, letzter Abruf am 04.03.2020. 
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und Diensten für die hydrographische, maritime und geoinformatische Ge- 
meinschaft gedacht ist. Die einzelnen Bestandteile basieren auf Standards, 
die durch das International Organization for Standardization Technical 
Committee 211 (ISO/TC211) entwickelt wurden. 


Für die Entwicklung sind insbesondere auch die Erfahrungen aus der Verwen- 
dung bisheriger Standards für hydrographische Informationen (S-57) einge- 
flossen. S-100 verwendet als Grundlage Klassen-, Objekt- und Paketdiagram- 
me nach der Unified Modelling Language. Der S-100-Standard bietet einen 
theoretischen Rahmen von Komponenten, der auf der ISO 19100-Serie auf- 
baut. Diese Standards und Spezifikationen werden auch als Grundlage für die 
meisten aktuellen Aktivitäten zur Entwicklung von Geostandards verwendet 
und sind eng mit anderen Initiativen zur Entwicklung von Standards verbun- 
den, wie z.B. dem Open Geospatial Consortium (OGC). Die IHO hat auch 
zugehörige Register entwickelt, die in Verbindung mit dem S-100-Standard 
verwendet werden sollen. Sie stellen die Infrastruktur und die Mechanismen 
zur Verfügung, die erforderlich sind, um die oben aufgeführten Ressourcen 
zu verwalten, zu pflegen und bei Bedarf zu erweitern. 


Das Datenmodell besteht aus zwölf zusammenhängenden Teilen, die 
einem/einer Anwender/-in die entsprechenden Werkzeuge und den Rah- 
men für die Entwicklung und Pflege von hydrographischen Daten, Produkten 
und Registern geben. Sie spezifizieren für hydrographische und verwandte 
Informationen Methoden und Werkzeuge für das Datenmanagement, die 
Verarbeitung, die Analyse, den Zugriff, die Darstellung und die Übertragung 
solcher Daten in digitaler/elektronischer Form zwischen verschiedenen An- 
wendern/Anwenderinnen, Systemen und Standorten. S-100 beschreibt den 
Standard, der für den Austausch von hydrographischen und verwandten 
Geodaten zwischen nationalen hydrographischen Ämtern sowie zwischen 
anderen Organisationen und für die Weitergabe an Hersteller, Schiffer und 
andere Datennutzer verwendet werden soll. 
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2.3 Umweltmodellierung in der 
Entscheidungsunterstützung 


Die Umweltmodellierung beschäftigt sich mit der Abbildung der realen Um- 
gebung in eine maschinell interpretierbare Repräsentation [Kak87]. Hierbei 
sind insbesondere die Verknüpfung der durch Sensorik erschlossenen Infor- 
mationen mit Vorwissen über die Welt und die Darstellung und Präsentation 
zur Entscheidungsunterstützung von besonderer Bedeutung. 


Zunächst wird hier der generelle Informationsfluss eines EUS in Überwa- 
chungsszenarien dargestellt. Hierbei wird insbesondere darauf eingegangen, 
an welcher Stelle ein Umweltmodell von Bedeutung ist. Im Anschluss werden 
allgemein anerkannte Modelle zur Datenfusion erläutert. Darauf aufbauend 
wird das OOWM als eine Ausprägung eines Weltmodells vorgestellt. 


2.3.1 Informationsfluss in Überwachungssystemen 


Überwachungssysteme werden dazu eingesetzt, räumlich-zeitlich begrenzte 
Ausschnitte der realen Welt zu beobachten. Der Informationsfluss in solchen 
Systemen wurde in [Fis12, Fis16] näher skizziert. Diesen Arbeiten folgend 
werden alle Elemente der realen Welt als Entitäten bezeichnet. Eine Entität 
repräsentiert hier neben physikalischen Objekten auch Objektattribute sowie 
Beziehungen zwischen Objekten, Ereignissen und Situationen. Die Gesamt- 
heit der Entitäten beschreibt dann den vollständigen Zustand der realen Welt 
auf allen Abstraktionsebenen. 


In Abbildung 2.2 wird der Informationsfluss zwischen diesen Entitäten der 
realen Welt und einem Überwachungssystem dargestellt. Ellipsen bezeichnen 
Prozesse und Rechtecke die Informationsaggregate. Der generelle Kreislauf 
beginnt bei der Beobachtung der realen Welt. Die dabei entstehenden Sensor- 
daten werden zusammen mit dem vorhandenen Wissen über die Welt aus- 
gewertet. Das Resultat dieser Auswertung ist ein Weltmodell. Durch dieses 
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Weltmodell kann zum einen ein Lernprozess bedient werden, der das Hin- 
tergrundwissen anreichert. Zum anderen kann zusammen mit dem Hinter- 
grundwissen ein Inferenzprozess bedient werden. Dieser kann durch Schluss- 
folgerungen Informationen zu nicht beobachtbaren oder nicht beobachteten 
Entitäten generieren und dem Weltmodell wieder zurückgeben. Außerdem 
kann ein Plan entwickelt werden, der durch den letzten Prozess, das Handeln, 
eine Interaktion mit der realen Welt ermöglicht. Die einzelnen Prozesse kön- 
nen sowohl autonom durchgeführt als auch durch den Menschen interaktiv 
beeinflusst werden. 


Im Folgenden wird auf die einzelnen Prozesse genauer eingegangen: 


Beobachten: Der erste Schritt, das Beobachten, besteht in der Erfassung der 
realen Welt mit Hilfe von Sensoren. Ein Sensor kann hierbei neben ei- 
nem technischen Gerät auch der Mensch sein, der Informationen in das 
Überwachungssystem gibt. Nicht alle Entitäten der realen Welt sind be- 
obachtbar und nicht alle Entitäten der realen Welt werden beobachtet, 


obwohl die Sensorik diese erfassen könnte. Die verwendete Sensorik 


Reale Welt Informations- 
Entitäten aggregat 
Wissen 
Handeln Beobachten 


Konzepte und Methoden 


Weltmodell 
Repräsentanten 


y 


Sensordaten 


Inferenz 


Überwachungssystem 


Abbildung 2.2: Schematischer Informationsfluss in Überwachungssystemen nach [Fis12] 
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kann wie in Abschnitt 2.2 beschrieben heterogen gestaltet sein. Dies be- 
zieht sich nicht nur auf die Sensormodalität (z. B. elektro-optisch, Radar 
etc.), sondern auch auf Abdeckungsbereiche, Abtastraten usw. 


Auswerten: Der Auswertung der Sensordaten seht Wissen in Form von Kon- 
zepten und Methoden zur Verfiigung, um ein Weltmodell zu formen. Die 
abstrakten Konzepte dienen hierbei als Blaupause, um mögliche Klassen 
von Entitäten im Weltmodell beschreiben zu können. Die Signalverar- 
beitung wird durch die Methoden durchgeführt. Diese beinhalten also 
Algorithmen, um bspw. in Bilddaten Objekte zu erkennen. 


Das Weltmodell enthält für Entitäten der realen Welt Repräsentanten. 
Die Konzepte des Wissens geben dabei einen Rahmen vor, um Reprä- 
sentanten aus den Sensordaten abzuleiten. Sie enthalten also bspw. die 
Objektmerkmale eines bestimmten Typs. Bedingt durch die dynami- 
sche Umgebung werden Informationen im Weltmodell über eine ge- 
wisse Zeit bereitgehalten. Dies ermöglicht den zeitlichen Verlauf eines 
Ereignisses besser zu interpretieren. 


Lernen: Das erstellte Weltmodell kann dazu verwendet werden, innerhalb 
eines Lernprozesses neues Wissen zu generieren. Dies kann bspw. ein 
Verhaltensmuster sein, das durch maschinelle Lernverfahren bestimmt 
wurde. 


Inferenz: Informationen über nicht direkt beobachtbare Entitäten können 
mit Hilfe des Weltmodells und eines Inferenzprozesses abgeleitet wer- 
den. Dieser nutzt die Methoden und Konzepte des Wissensaggregats, 
um aus den Informationen des Weltmodells weitere Informationen ab- 
zuleiten, die das Weltmodell anreichern. Dies kann bspw. die Geschwin- 
digkeit sein, wenn nur der zeitliche Verlauf von Positionsdaten zur Ver- 
fügung steht. 


Des Weiteren kann über die Inferenz ein Plan generiert werden, der 
Handlungsvorschläge umfasst. Handlungsvorschläge sind bspw. die 
Anpassung der Sensorik sowie der Einsatz weiterer Sensoren bzw. Sen- 
sorträger oder Anweisungen an Entitäten, um Ereignisse zu verhindern 
(z.B. eine Kollision zwischen zwei Schiffen). 
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Handeln: Der Zyklus wird durch das Handeln geschlossen. Hierbei werden 
ausgewählte oder alle Handlungsvorschläge durchgeführt. Diese haben 
einen direkten Einfluss auf die reale Welt und verändern damit ggf. de- 
ren Zustand. 


2.3.2 Datenfusion als Grundlage für die 
Umweltmodellierung 


Datenfusion steht für maschinelle Konzepte in Analogie zu menschlichen und 
tierischen Fähigkeiten, unterschiedliche Sinneseindrücke, Erfahrungen und 
logisches Denkvermögen zu kombinieren [Mit12]. Diese Prozesse dienen Tie- 
ren und Menschen dazu, die Überlebenschancen zu erhöhen [Hal01], indem 
bspw. die Umgebung besser beurteilt wird und damit Bedrohungen identifi- 
ziert werden. 


Hall und Llinas [Hal01] sowie Klein [Kle04] sind sich einig, dass häufig meh- 
rere sich ergänzende Sensoren nötig sind, um eine Situation korrekt einzu- 
schätzen. Dabei ergeben sich drei generelle Vorteile beim Einsatz multipler 
Sensoren [Kle04, S. 2£.]: 


« Aufgrund der zugrundeliegenden Sensormodalität und der 
objektabhängigen Signatur können ggf. einige Objekte nur durch 
bestimmte Sensoren erkannt werden. 


« Die Signatur eines Objekts kann gegenüber einer bestimmten 
Sensormodalität maskiert oder durch Gegenmaßnahmen geschützt 
sein, nicht aber gegenüber einer anderen. 


« Durch Verdeckungen kann die Sicht durch einen Sensor eingeschränkt 
sein. Durch einen zweiten Sensor kann ggf. trotzdem das Objekt 
weiter beobachtet werden. 


Eine generelle Übersicht über das Thema Datenfusion geben bspw. die Fach- 
bücher von Mitchell [Mit12], Klein [Kle04] oder Hall und Llinas [Hal01]. In 
der Literatur werden Begriffe wie »Sensorfusion«, »Datenfusion«, »Informa- 
tionsfusion« und »Multisensor-Datenfusion« jedoch nicht immer einheitlich 
gebraucht. 
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Der Begriff »Informationsfusion« wird z.B. von Dasarathy als Oberbegriff für 
alle Fusionsprozesse gesehen. Er schreibt dazu: 


»Information Fusion encompasses theory, techniques and 
tools conceived and employed for exploiting the synergy in the 
information acquired from multiple sources (sensor, databases, 
information gathered by human, etc.) such that the resulting 
decision or action is in some sense better (qualitatively or quan- 
titatively, in terms of accuracy, robustness, etc.) than would be 
possible, if any of these sources were used individually without 
such synergy exploitation.« [Das01, S. 75] 


Demgegenüber sieht White »Datenfusion« als Oberbegriff, der auch die »In- 
formationsfusion« mit einschließt. So definiert die Datenfusionsgruppe des 
Joint Directors of Laboratories (JDL) »Datenfusion« wie folgt: 


»A process dealing with the association, correlation, and com- 
bination of data and information from single and multiple sources 
to achieve refined position and identity estimates, and complete 
and timely assessments of situations and threats as well as their 
significance.« [Whi91, S. 5] 


Eine prägnante Zusammenfassung dieser Definition gibt Lambert: 


»Data fusion is the process of utilising one or more data sources 
over time to assemble a representation of aspects of interest in an 
environment.« [Lam01a, S. 2] 


Der Begriff »Sensorfusion« bezeichnet nach Klein [Kle04, S. 2] die Kombinati- 
on aus mehreren Sensoren, um so genauere oder zusatzliche Daten beziiglich 
Ereignissen und Objekten im Beobachtungsraum der Sensoren zu erhalten. 
Im Gegensatz dazu sehen bspw. Lambert [Lam03] und Snidaro et al. [Sni11] 
jedoch nur die resultierenden Objektinformationen, aber keine Ereignisse als 
Ergebnis der »Sensorfusion«. 


»Multisensor-Datenfusion« richtet insbesondere den Fokus auf die Auswer- 
tung mehrerer Sensoren, um eine Aufgabe zu erfüllen. Mitchell definiert diese 
wie folgt: 
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»[T]he theory, techniques and tools which are used for com- 
bining sensor data, or data derived from sensory data, into a com- 
mon representational format.« [Mit12, S. 1] 


Ziel dabei ist, die Qualität der Informationen im Gegensatz zur losgelösten 
Auswertung der einzelnen Quellen zu verbessern. 


Weitere, insbesondere im englischen Sprachgebrauch gängige Begriffe sind 
»Low-Level Data Fusion« und »High-Level Data Fusion«. Nach Blasch 
et al. [Bla12] wurden diese Begriffe von Waltz et al. [Wal90] eingeführt. Die 
sensornahen Prozesse (z.B. Merkmalsextraktion und Zustandsschätzung) 
werden hierbei als »Low-Level Processing« zusammengefasst, wohingegen 
Situations- und Bedrohungsbewertung (zusammen mit Verhaltensanalysen, 
Verknüpfung zwischen Entitäten und Ereignissen und Prädiktionen zukünf- 
tiger Zustände) als »High-Level Processing« zusammengefasst werden. Dies 
deckt sich mit der folgenden Definition nach Klein: 


»Data fusion consists of low-level and high-level processes. 
The low-level processes include target detection, classification, 
identification, and tracking. High-level processes encompass sit- 
uation and threat assessment.« [Kle04, S. 95] 


Damit deckt die Datenfusion alle Prozesse bis auf »Handeln« aus dem generel- 
len Informationsfluss aus Abschnitt 2.3.1 ab. Der Prozess »Beobachten« zielt 
dabei auf die »Low-Level Data Fusion« ab, wohingegen die Prozesse »Aus- 
werten«, »Lernen« und »Inferenz« zum Bereich der »High-Level Data Fusi- 
on« gehören. Die beiden im Folgenden vorgestellten Modelle zur Datenfusion 
können ihrerseits auch direkt auf die Prozesse des Informationsflusses abge- 
bildet werden. 


In dieser Arbeit wird »Datenfusion« analog zu [Whi91] als Oberbegriff 
für »Sensor- und Informationsfusion« gesehen. Ihr Resultat fasst wie nach 
[Kle04] beschrieben Informationen zu Objekten und Ereignissen zusammen. 
Allgemein wird von einer »Multisensor-Datenfusion« ausgegangen, also 
der Beteiligung mehrerer (heterogener) Sensorquellen (siehe Abschnitt 2.2). 
Die aufgezeigten Methoden und Verfahren können der »High-Level Data 
Fusion« zugeordnet werden. 
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Ein generelles Modell zur Datenfusion wurde in Form des JDL Data Fusion 
Model (bzw. JDL-Modell) durch die U.S. JDL Data Fusion Group entwickelt 
und 1988 vorgestellt. Es wurde ursprünglich entworfen, um der Kommunika- 
tion zwischen Experten/Expertinnen zum Thema Datenfusion einen Rahmen 
zu geben [Das08]. Das JDL-Modell stellt damit keine vollständige Architektur 
der verschiedenen Prozesse und Interaktionen dar und wurde über die Jah- 
re immer wieder angepasst [Ste98, Ste99, Ste01, Lli04]. Das durch Steinberg 
und Bowman in [Ste04] vorgestellte Modell besteht aus fünf Leveln und ist 
in Abbildung 2.3 dargestellt. 


Bedworth und O’Brien [Bed99] beschreiben die verschiedenen Level wie folgt: 


Level 0 bezieht sich auf die Signalverarbeitung und die grundsätzliche Aus- 
wertung der vorhandenen Sensordaten und deren räumlich-zeitliche 
Registrierung. 


Level 1 beschreibt die Schätzung und Prädiktion der kontinuierlichen (z.B. 
Kinematik und Position) und diskreten (z.B. Identität) Zustände von 
Objekten. 


Level 2 verfeinert das Bild der vorhandenen Situation durch die Untersu- 
chung der Relationen zwischen den unterschiedlichen Entitäten und 


Datenfusions-Domäne 


Level 0 Level 1 Level 2 Level 3 
Signal- Objekt- Situations- Auswirkungs- 
verarbeitung erkennung analyse analyse 


Datenquellen 


Mensch-Maschine-Schnittstelle 


Datenbank-Management-System 


E E 


Support- Fusions- 
Datenbank Datenbank 


Level 4 
Prozess- 
optimierung 


Abbildung 2.3: JDL-Modell nach [Ste04] 
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Ereignissen im Kontext der Umgebung, um die Situation interpretier- 
bar zu machen. 


Level 3 befasst sich mit den unterschiedlichen Handlungsmöglichkeiten und 
ihren Auswirkungen auf die gegenwärtige Situation. 


Level 4 beschreibt die Optimierung des Ressourceneinsatzes. Hierbei werden 
die vorhandenen Sensoren, Kommunikationsmöglichkeiten etc. erneut 
beauftragt, um vorhandene Ziele zu erfüllen. 


Zu den Datenquellen (links in Abbildung 2.3) gehören nach Das [Das08, S. 
3] lokale und entfernte Sensoren, die für das Datenfusionssystem zugänglich 
sind, Informationen aus dem Referenzsystem und menschliche Eingaben. Die 
Mensch-Maschine-Schnittstelle (rechts in Abbildung 2.3) dient zur Interaktion 
des Menschen mit dem Datenfusionssystem. Das Datenbank-Management- 
System beinhaltet die Verwaltung der für die Fusion relevanten Daten (z.B. 
Sensordaten, Umweltinformationen, Modelle und Schätzungen). 


Nach Lambert [Lam01b] kann eine Verbindung zwischen dem JDL-Datenfusi- 
onsmodell und dem Situationsbewusstsein nach Endsley (siehe Abschnitt 2.1) 
hergestellt werden. Die Level 1 bis 3 aus dem Situationsbewusstseinsmodell 
lassen sich, wie in Abbildung 2.4 dargestellt, direkt den Leveln 1 bis 3 des 
JDL-Modells zuordnen. 


Kognitive Ebene 


Situations- | Wahrnehmung | | Verstehen | | Projektion | 
bewusstsein 


Maschinelle Ebene 


JDL-Daten- Objekt- Situations- Auswirkungs- 
fusionsmodell erkennung analyse analyse 


Abbildung 2.4: Beziehung zwischen Datenfusion und Situationsbewusstsein nach [Lam01b] 
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2.3.3 Grundlagen zum Objektorientierten Weltmodell 


In [Ghe08] stellen Gheta et al. das Objektorientierte Weltmodell (OOWM) 
als eine auf einem objektorientierten Ansatz basierende Umweltmodellierung 
vor. Das OOWM folgt dem in Abschnitt 2.3.1 dargestellten Informationsfluss. 
Abbildung 2.5 zeigt eine schematische Darstellung des Modells. Dieses Welt- 
modell soll autonomen Systemen ermöglichen auf das Wissen über die Um- 
gebung zuzugreifen. Dabei dient das OOWM als Informationszentrale für die 
sensorischen und kognitiven Prozesse. 


Basierend auf wahrscheinlichkeitstheoretischen Überlegungen werden Pro- 
zesse zum Hinzufügen, Aktualisieren und Löschen vorgestellt. Gheta et al. 
[Ghe10] lassen dafür das Modell auf den folgenden drei Säulen fußen: 


« Jede Information ist assoziiert mit einem Objekt und einer 
Relationsinstanz, 


« jede Information enthält eine Aussage über ihre Unsicherheit als 
Degree of Belief (DoB), 


e die Verarbeitung der Informationen und die Qualitätssicherung des 
Modells basieren auf Bayes’schen Fusionsmechanismen. 


Im OOWM existieren für mögliche Ausprägungen der Entitäten der realen 
Welt Klassen. Bei einer Beobachtung wird für eine Entität eine passende In- 
stanz zu der jeweiligen Klasse erstellt. Diese wird im OOWM als Repräsentant 
bezeichnet. Beobachtbare Eigenschaften einer Entität werden als Attribute 
dargestellt. Diese werden über eine Wahrscheinlichkeitsverteilung beschrie- 
ben, die den DoB repräsentiert. 


Das Konzept der Klassen ermöglicht es, verschiedene Abstraktionsniveaus 
darzustellen [Küh10]. Die Klassen befinden sich in Relation zueinander, wo- 
bei eine Kinderklasse mindestens die gleiche Anzahl an Attributen wie die 
Elternklasse besitzt. Werden die Repräsentanten zum Beginn eines Einsatzes 
noch mit wenigen Informationen instanziiert, so werden die Informationen 
über den weiteren Zeitraum angereichert und der Abstraktionsgrad für die 
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einzelne Instanz verringert sich. Die dafür benötigte Aktualisierung des Welt- 
modells wird in [Bau10b, Ghe10] als Bayes’sches Filterproblem modelliert. 


Modell (Repräsentanten & Konzepte) 


Abbildung 2.5: Schematische Darstellung des Objektorientierten Weltmodells nach [Ann19a] 


Eine Herausforderung ist die Datenassoziation. Hierbei wird entschieden, ob 
eine Beobachtung einem Repräsentanten zugeordnet werden kann. Diese Pro- 
blematik ist Teil der Datenfusion. Da im OOWM eine hierarchische Struktur 
vorliegt, kann diese für die Assoziation ausgenutzt werden, um damit das Er- 
gebnis zu verbessern [Bel15]. 


Das OOWM wurde bereits für unterschiedliche Anwendungsdomänen er- 
probt. Dazu zählen humanoide Roboter [Bau10b], Videoüberwachungssyste- 
me [Emt08, Bau10a] und maritime Überwachungsszenarien [Kuw12, Fis16]. 
Die hier im Folgenden genutzte zugrundeliegende Formalisierung orientiert 
sich dabei an [Kuw16]. 


Im OOWM werden für alle (in der Anwendungsdomäne relevanten) Entitä- 
ten £ der realen Welt, die durch die vorhandenen Sensoren beobachtet wer- 
den können, Repräsentanten erstellt. Ein Repräsentant R E€ R wird durch eine 
Menge von Attributen beschrieben: Ap = {A,, ..., An} n € N. Ein Attribut A; 
wird durch eine Wahrscheinlichkeitsverteilung P4,(a) als DoB in dem Wert 
des Attributs dargestellt. Die Verteilung P 4,(a) kann sowohl diskret als auch 
kontinuierlich sein. Der Repräsentant R kann durch die Verbundwahrschein- 
lichkeitsverteilung 


P(R) = P(Ag) = ]] Pata) (2.1) 


AGAR 
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dargestellt werden. Um eine Entität E auf den zugehörigen Repräsentanten R 
abzubilden, wird ein Assoziationsmechanismus benötigt. Weitere Details zu 
diesen Algorithmen können z.B. [Bau10b] entnommen werden. 


Das Hintergrundwissen wird in Form von Konzepten € gespeichert. Die Kon- 
zepte bestehen dabei aus einer Menge von Attributen und können als Proto- 
typen für Repräsentanten angesehen werden. Ein Konzept C € € ist durch 
eine Menge an Attributen Ac = {A,,..., Am} m € N gegeben. Ein Konzept 
C kann durch die Verbundwahrscheinlichkeitsverteilung 


P(C)=P(Ac)= ]] Pala) (2.2) 


AEAc 


beschrieben werden. 


Die Assoziationswahrscheinlichkeit eines Repräsentanten R zu einem Kon- 
zept C ist nach [Kuw16] gegeben durch 


P(C | R) = =P(C) II | | P,,(a)- Pa,(a) da) (2.3) 
R 


AjEAR 


mit A. als korrespondierendem Attribut des Konzeptes C zu dem Attribut A; 
des Repräsentanten R und z als Normalisierungsparameter. 


Die formale Beschreibung einer Situation orientiert sich an [Fis16]. Nach Ye 
et al. ist eine Situation wie folgt beschrieben: 


»A situation is defined as an external semantic interpretation 
of sensor data. Interpretation means that situations assign mean- 
ings to sensor data. External means that the interpretation is from 
the perspective of applications, rather than from sensors. Seman- 
tic means that the interpretation assigns meaning on sensor data 
based on structures and relationships within the same type of sen- 
sor data and between different types of sensor data.« [Ye12, S. 39] 


Eine Situation S muss nicht unbedingt von allen Repräsentanten abhängen. 
Die Untermenge der relevanten Repräsentanten ist durch R” C R gegeben. 
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Der Zustandsraum einer Situation ist dann gegeben durch 


QOs= XRxT=X X AxT. (2.4) 


RER" RER" AjEAR 


Mit T wird hier die Zeitdimension bezeichnet. Die einzelnen Zeitpunkte t € 
T können entweder kontinuierlich T = R$ oder diskret T = N sein. Eine 
Situation S; zum Zeitpunkt t kann als Abbildung beschrieben werden: 


S: Qs > {0,1}. (2.5) 
Dabei beschreibt S, = 0 oder S;, dass eine Situation nicht existiert, wohinge- 
gen S; = 1 oder S; beschreibt, dass sie existiert. 


Ein Element des Zustandsraums Qg zum Zeitpunkt t wird als œ € Qs be- 
zeichnet. Eine Trajektorie durch den Zustandsraum für ein Zeitintervall d = 
(ti, t2,- , tk) wird durch die Elemente wg = (w4, ®t». , Ot) beschrieben. 
Eine Situation Sg über ein Zeitintervall d ist durch 


k 
Sa: KOs > {0,1} (2.6) 
i=1 


gegeben. 


Die Existenz einer Situation zu einem Zeitpunkt t (bzw. analog für ein Zeitin- 
tervall d) kann durch Wahrscheinlichkeiten beschrieben werden. Daher kann 
S, als binäre Zufallsvariable angesehen werden: 


e Lg ist eine Sigma-Algebra auf Qs und daher eine Untermenge der 
Potenzmenge von Qs. 


e P ist ein Wahrscheinlichkeitsmaß auf (Qg, Xs). 


e (Qs, Ès, P) ist ein Wahrscheinlichkeitsraum und P eine Verteilung für 
S, mit der Existenzwahrscheinlichkeit P(S, = s) für s € {0, 1}. 


Durch diese Definitionen ist es möglich, Aussagen über die Existenz einer 
Situation durch die Inferenz über die Trajektorie wg zu treffen. 
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Konzepte, Attribute, aber auch mögliche Situationen müssen an die jeweilige 
Anwendungsdomäne angepasst werden. Hierzu können im maritimen Raum 
bspw. die in Abschnitt 2.2.4 vorgestellten Standards als Grundlage benutzt 
werden. 


2.4 Anomaliedetektion in räumlich-zeitlichen 
Datensätzen 


Die Anomaliedetektion behandelt Verfahren, um innerhalb eines Datensatzes 
jene Instanzen zu identifizieren, die nicht mit dem normalen Verhalten über- 
einstimmen. Dazu schreiben Chandola et al.: 


»Anomaly detection refers to the problem of finding patterns 
in data that do not conform to expected behavior.« [Cha09, S. 1] 


Laut dieser Definition geht es also um das Auffinden von Mustern, die so nicht 
zu erwarten sind. 


Ausgehend von dem durch Endsley eingeführten Modell des Situationsbe- 
wusstseins sollen Verfahren der Anomaliedetektion eine automatische Unter- 
stützungsfunktion anbieten, um große Datenmengen für den Menschen bes- 
ser handhabbar zu machen. Solche Algorithmen lassen sich dem Level 2 (oder 
höher) des JDL-Modells zuordnen. 


Eine allgemeine Übersicht über das Thema Anomaliedetektion wurde von 
Chandola et al. [Cha09] zusammengestellt. In diesem Übersichtsartikel wer- 
den Anomalien in drei Kategorien unterteilt: 


e Punkt-Anomalien (engl. »point anomaly«): Wenn ein einzelnes Datum 
als anormal in Hinblick auf die restlichen Daten gewertet werden 
kann, wird dieses Datum als eine Punkt-Anomalie angesehen. 


e Kontext-Anomalien (engl. »contextual anomaly« oder »conditional 
anomaly«): Ein Datum gilt als anormal innerhalb eines gegeben 
spezifischen Kontextes. Hierbei werden Kontextattribute und 
Verhaltensattribute betrachtet. Ein Kontextattribut ist z.B. in 
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räumlichen Datensätzen Breiten- und Längengrad. Unter 
Verhaltensattributen werden alle Nichtkontextattribute verstanden. 


e Kollektiv-Anomalien (engl. »collective anomaly«): Eine Sammlung an 
zusammengehörigen Daten wird als Kollektiv-Anomalie bezeichnet, 
wenn diese durch ihr gemeinsames Auftreten als anormal angesehen 
werden kann. 


Riveiro et al. [Riv18] greifen diese Überlegungen in ihrem Übersichtsartikel 
zur Anomaliedetektion im maritimen Anwendungsbereich auf. Zusätzlich zu 
der durch Chandola et al. aufgestellten Teilung in drei Anomaliekategorien 
werden von Riveiro et al. folgende weitere Unterteilungen vorgenommen: 


« Datenbezogene Anomalien 

« Positionsbezogene Anomalien 
e Kinematische Anomalien 

e Kontextuelle Anomalien 

« Komplexe Anomalien 


In den hier betrachteten Überwachungsszenarien kann allgemein davon aus- 
gegangen werden, dass räumlich-zeitliche Daten vorliegen. Punkt-Anomalien 
entsprechen hier einem Datum zu einer bestimmten Zeit, während Kollektiv- 
Anomalien eine Trajektorie betreffen. Kontext-Anomalien bedingen weitere 
Informationen, also den eingebetteten Kontext. Die ersten drei Kategorien 
für maritime Anomalien können sowohl als Punkt- als auch als Kollektiv- 
Anomalien auftreten. Bei den kontextuellen und komplexen Anomalien nach 
Riveiro et al. handelt es sich nach der Unterteilung von Chandola et al. um 
Kontext-Anomalien. Die Einteilung in die verschiedenen Kategorien ist nicht 
immer trennscharf möglich. 


Um Anomalien erkennen zu können, muss das Normalverhalten extrahiert 
werden. Laut Riveiro et al. [Riv18] werden drei generelle Vorgehensweisen 
unterschieden: 


« Datengetriebene Verfahren 
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Tabelle 2.3: Übersicht zum Stand der Forschung im Bereich Anomaliedetektionsverfahren in 
räumlich-zeitlichen Datensätzen (insbesondere aus dem maritimen Raum) 


= 
E E 
ac BE ale 
s è lg Bla > 
2 8 als RIF 2 
z 6 EJS Bla & 
a Mm M/A JA E 
Statistische Ausreißer 
[Lax09, Mil16, Kow12] | E E E 
[Lax14, Kat13, Eti12] | E m E 
[Liu14] a E E E 
Clusteranalyse 
[Gui13, Pal13a] | E E E 
[Mel06, Sha14b, Dah07, Ros12] | W E E 
[Vri12] | E E | 
Probabilistische graphische Modelle 
[Sai18, And10, Sou16] | E | | 
[Lan10, Pil12, Krii12] | E E 
[Fis14, Dab15] | | | 
Künstliche neuronale Netze 
[Ngu18, Ngu19, Jia16, Jia17] | M E E 
[Abu18, Aki17] E E a 
Multiagentensystem 
[Yan07, Man10] | E E 
[Bra11] E E E 
Fuzzylogik 
[Tes17] E E E 
[Pri17] E E E 
andere 
Regelbasiert: [Pat17] E E E 
NLP: [Tes18] E E 
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e Signaturbasierte Verfahren 
« Hybride Verfahren 


Datengetriebene Verfahren sind zumeist unüberwachte Lernmethoden. Es wird 
davon ausgegangen, dass die Daten zum größten Teil aus normalen Instanzen 
bestehen. Für Anomalien wird nun versucht die Abweichung zu definieren. 
Signaturbasierte Verfahren sind Expertensysteme, die z.B. auf Regeln basie- 
ren, um so vordefinierte Muster wiederzuerkennen. Es handelt sich hier also 
meistens um überwachte Lernmethoden. Hybride Verfahren kombinieren die 
beiden Ansätze. Für gewisse Faktoren ist es einfacher, ein datengetriebenes 
Modell zu generieren, während die Spezifika von komplexen Anomalien häu- 
fig nur schwer in den Daten zu finden sind. 


In Tabelle 2.3 ist eine Übersicht zu den im Folgenden vorgestellten Arbeiten 
aus dem Bereich Anomaliedetektion in räumlich-zeitlichen Datensätzen mit 
Hauptaugenmerk auf dem maritimen Raum zu finden. In der Übersicht wer- 
den die verschiedenen Arbeiten nach ihrer grundsätzlichen Methodik grup- 
piert und die Art der Anomaliedetektion, das Extraktionsverfahren sowie der 
Aspekt, ob einzelne Datenpunkte oder Tracks (ganze Trajektorien) / Tracklets 
(Teiltrajektorien) betrachtet werden, gekennzeichnet. 


2.4.1 Positions- und kinematische Anomalien 


Eine Möglichkeit, punktweise Positions- und kinematische Anomalien zu 
erkennen, besteht aus der Betrachtung der Position, Geschwindigkeit oder 
anderer Zustandsgrößen im vorliegenden Datensatz als Wahrscheinlichkeits- 
verteilungen. Durch die Verwendung von Daten des bisherigen Verkehrs 
in einer bestimmten Region kann die Wahrscheinlichkeitsdichte bestimmt 
werden. Daraus abgeleitet kann über einen Grenzwert die Position ei- 
nes Schiffs als Anomalie gewertet werden. So vergleichen Laxhammar et al. 
[Lax09] zwei Verfahren zur Schätzung der Wahrscheinlichkeitsdichte: Kernel- 
Density-Estimation (KDE) und Gaussian-Mixture-Model (GMM). Sie trainieren 
die Modelle mit realen Daten und bewerten die Leistung der Algorithmen 
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mit künstlichen Anomalien. Um die Leistung der Modelle zur Reproduk- 
tion des normalen Verhaltens zu bewerten, wird die Log-Likelihood (im 
Deutschen auch logarithmische Plausibilitätsfunktion) für alle Punkte der 
Validationsdaten berechnet und daraus werden der Median und das erste 
Perzentil bestimmt. Für die Leistung der Anomaliedetektion wird die für die 
Erkennung einer Anomalie erforderliche Anzahl an Beobachtungen vergli- 
chen. Dieses Verfahren kann keine Anomalien erkennen, für die der Verlauf 
(vollständig oder teilweise) der Trajektorie von Bedeutung ist. 


Um den Verlauf einer Trajektorie zu bewerten, wurde von Laxhammar 
[Lax14] der Algorithmus Conformal Anomaly Detector basierend auf der 
Conformal-Prediction-Methodik nach [Vov05] vorgestellt. Die Conformal- 
Prediction-Methodik liefert zuverlässige und gut kalibrierte Maße für das 
Vertrauen in die Vorhersagen, die von Verfahren des maschinellen Lernens 
getroffen werden. Der Conformal Anomaly Detector soll die untere Grenze 
für die Wahrscheinlichkeit, dass eine Vorhersage korrekt ist, abschätzen. Zur 
Berechnung der Ähnlichkeit zwischen zwei Trajektorien wird der Hausdorff- 
Abstand verwendet. Der Algorithmus wird mit realen Daten eingelernt. Die 
Anomalien für die Validierung werden hingegen simuliert. Diese simulierten 
Anomalien sind bestimmten Verhaltensmustern nachempfunden, z.B. einem 
Schiff, dessen Ruder sich nicht mehr bewegen lässt. Diese ausgewählten 
künstlichen Anomalien wurden dabei erfolgreich erkannt. 


Ein statistischer Hypothesentest wird von Katsilieris et al. [Kat13] benutzt, 
um Verfälschungen der AIS-Daten zu erkennen. Diese Information kann dann 
wiederum dazu verwendet werden, um Rückschlüsse auf illegales Verhalten 
zu erlangen. 


Neben diesen statistisch motivierten Verfahren wird das Normalverhalten 
zur Erkennung von kinematischen Anomalien auch durch Clustering- 
Algorithmen bestimmt. In der Arbeit von Etienne et al. [Etil2] wird ein 
Zonengraph erstellt, der die Verbindung zwischen wichtigen Interessens- 
gebieten darstellt. Die Verbindung zwischen diesen Zonen wird als Route 
definiert. Auf der Grundlage aller Trajektorien in einer Route wird die 
Hauptroute bestimmt. Für jede Trajektorie wird die Entfernung zur Route 
berechnet und das neunte Dezil dieser Entfernungen wird als Hüllkurve 
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um die Route definiert. Ein Punkt außerhalb der Hülle wird als Ausreißer 
betrachtet. Angesichts der relativen Zeit, die ein Schiff auf der Route im 
Vergleich zur Hauptroute benötigt, können Ausreißer in Form von späten 
oder frühen Schiffen identifiziert werden. 


Melo et al. [Mel06] schlagen einen Merkmalsraum vor, der Polynome nied- 
rigen Grades für die Erkennung und Klassifizierung von Straßenspuren 
verwendet. Als Clusteranalyse zum Zusammenfassen ähnlicher Trajektorien 
wird ein k-Means-Algorithmus verwendet. Die verschiedenen Fahrspuren 
werden weiter in Kategorien klassifiziert. Der vorgeschlagene Algorithmus 
wird mit realen Daten getestet. 


Shao et al. [Sha14b] verwenden für die Korrelation der Trajektorien und die 
Clusteranalyse einen Fuzzy-k-Nearest-Neighbor-Ansatz sowie den Fuzzy-c- 
Means-Algorithmus. Es wird Fuzzy-Logik zur Modellierung von Unsicher- 
heiten in den Trajektorien verwendet. Die vorgeschlagenen Algorithmen 
werden mit verschiedenen Arten von Abtastsystemen ausgewertet. 


Dahlbom und Niklasson [Dah07] verwenden Splines, um die Haupttrajekto- 
rie eines Clusters darzustellen. Es werden die zugrundeliegenden Daten un- 
ter Verwendung des Mittelwertes der normierten Abstände zwischen jedem 
Trajektorienpunkt und dem nächstgelegenen Clusterpunkt zusammengefasst. 
Anschließend werden die Cluster mit Hilfe von Splines geschätzt, um die 
Komplexität der Darstellung zu reduzieren. 


Ein Algorithmus, der einen mittleren Pfad für normale Routen schätzt, wird 
von Rosen und Medvedev [Ros12] vorgeschlagen. Der mittlere Pfad ist defi- 
niert als die Trajektorie, die den euklidischen Abstand zu jeder anderen Tra- 
jektorie im gleichen Cluster minimiert. Anomalien werden dann durch den 
Vergleich einer neuen Trajektorie mit diesem mittleren Pfad erkannt und ein 
Anomaliewert wird berechnet. Der Algorithmus wird sowohl mit simulierten 
Daten als auch mit einem realen Datensatz ausgewertet. 


Basierend auf einem unüberwachten Lernverfahren werden Routen basierend 
auf AIS-Satellitendaten von Guillarme und Lerouvreur [Gui13] extrahiert. Zu- 
nächst werden die Trajektorien in Stopp- und Bewegungsanteile segmentiert. 
Danach werden die Bewegungsteile weiter in lineare Segmente aufgeteilt. 
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Diese linearen Segmente werden dann durch den OPTICS-Algorithmus zu 
Clustern gruppiert. Die Qualität jedes Clusters wird von Hand bewertet. 


Pallotta et al. [Pal13a, Pal13b] stellen den Algorithmus Traffic Route Extrac- 
tion and Anomaly Detection vor. Dieser verwendet den DBSCAN-Algorith- 
mus [Est96] zur Identifizierung von Haltebereichen und zur Clusteranalyse 
der Bewegungsmuster. Die Idee besteht darin, sowohl das Verhalten mit ge- 
ringer Wahrscheinlichkeit als auch die zukünftigen Positionen der Schiffe zu 
erkennen. Der Algorithmus ist punktbasiert und kann mit ungleicher Länge 
in den Trajektorien sowie mit Lücken aufgrund der Abdeckung der Senso- 
ren umgehen. 


Neben diesen Clustering-Algorithmen werden außerdem Verfahren unter- 
sucht, die den zeitlichen Verlauf innerhalb der Trajektorie direkt betrachten. 
Zur Beschreibung der normalen Trajektorie wird von Kowalska und Peel 
[Kow12] ein Gauß-Prozess verwendet. Das auf dem Gauß-Prozess basieren- 
de Regressionsmodell wird dazu genutzt, auf Basis von einer bestimmten 
Anzahl an Punkten einer Trajektorie den nächsten zu schätzen. Neben Ano- 
malien in Form von realen Daten, die in ihrer Position verschoben wurden, 
wurde das Verfahren auch in zwei Fallstudien erprobt. Hierbei konnte das 
anormale Verhalten, das durch die simulierten Szenarien Drogenschmuggel, 
Menschenschmuggel und Terrorismus generiert wurde, erkannt werden. 


Für die Vorhersage der Position von Schiffen auf offener See haben Millefiori 
et al. [Mil16] eine Methode auf Basis des Ornstein-Uhlenbeck-Prozesses vor- 
gestellt. Mit diesem stochastischen Prozess als Grundlage wird die Zustands- 
schätzung über längere Zeiträume ermöglicht. Bei ihrer Auswertung verglei- 
chen sie die auf dem Ornstein-Uhlenbeck-Prozess basierende Methode mit 
einem klassischen Ansatz, der auf einem Zufallsprozess mit additivem wei- 
Bem Rauschen auf der Geschwindigkeit basiert. Dabei zeigen Millefiori et al., 
dass ihr Ansatz eine deutlich bessere Abschätzung der Unsicherheit bzgl. der 
Position liefert als der Vergleichsansatz. 


Saini et al. [Sail8] schlagen einen auf dem Hidden Markov Model (HMM) ba- 
sierenden Ansatz für die Klassifizierung von Trajektorien vor. Sie kombinie- 
ren zwei unterschiedliche HMMs, eines für die Gesamttrajektorie und eines 
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für die einzelnen Segmente. Für die Kombination wird ein genetischer Algo- 
rithmus eingesetzt. Darüber hinaus testen sie die Robustheit dieser Methodik 
durch Hinzufügen von additivem weißem Gauß’schem Rauschen. 


Auch Andersson und Johansson [And10] verwenden ein HMM, um anormales 
Verhalten zu erkennen. Ziel ist es, Piratenangriffe aufzudecken. Sie trainieren 
das HMM mit simulierten Daten, die das normale Verhalten von Schiffen in 
einem bestimmten Gebiet beschreiben. Die Daten werden in diskrete Zustän- 
de unterteilt, die der Änderung spezifischer Werte ähneln: Abstand zu anderen 
Objekten, Schiffsgröße, Identifikationsnummer, Geschwindigkeit und Richtung. 
Anschließend wird das Modell mit Hilfe eines simulierten Piratenangriffs aus- 
gewertet. 


Souza et al. [Soul6] benutzen ein HMM, um Langleinenfischereischiffe® zu 
analysieren. Es soll der Bereich einer Trajektorie erkannt werden, in dem die 
Schiffe am Fischen sind. Hierbei wird nur die Geschwindigkeit des Schiffes 
betrachtet. Durch den spezifischen Verlauf des Geschwindigkeitsprofils kön- 
nen die Fischereiaktivitäten erkannt werden. Es werden außerdem Verhal- 
tensmuster zweier weiterer Fischereiarten bestimmt. Die gefundenen Muster 
können jedoch nicht die Fischereiart selbst klassifizieren, sondern nur anzei- 
gen, ob ein Schiff eines Typs gerade am Fischen ist. 


Neuere Arbeiten befassen sich mit (tiefen) neuronalen Netzen, um Anoma- 
lien zu erkennen. Ein rekurrentes neuronales Netz (RNN) wird von Nguyen 
et al. in [Ngu18] verwendet, um unvollständige Trajektorien zu rekonstru- 
ieren, Anomalien in den Verkehrsdaten zu erkennen und den tatsächlichen 
Typ eines Schiffes zu identifizieren. Da AIS-Daten nicht zwangsläufig äquidi- 
stant in der Zeit aufgenommen werden, wird ein Embedding verwendet, um 
eine neue Darstellung als Eingabe für das neuronale Netz zu generieren, die 
demgegenüber unempfindlich ist. 


Eine weitere Möglichkeit zum Einsatz neuronaler Netze wird von Nguyen 
et al. [Ngu19] in Form des sogenannten GeoTrackNet vorgestellt. Dieses Netz 


° Details zu diesen Schiffen können bspw. http://www.fao.org/fishery/vesseltype/260/en, letzter 
Abruf am 04.03.2020, entnommen werden. 
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bildet basierend auf einem Variational Recurrent Neural Network die Schiffstra- 
jektorien als probabilistische Repräsentation ab. Mit Hilfe dieser Repräsenta- 
tion wird durch eine A-contrario-Detektion auf Anomalien geschlossen. Dabei 
gilt, dass eine neue Positionsmeldung mit einer geringeren Wahrscheinlich- 
keit als bei den umliegenden Datenpunkten auf eine Anomalie hindeutet. 


Autoencoder werden von Jiang et al. [Jia16] zur Klassifikation von Abschnit- 
ten in Langleinenfischereischiffstrajektorien in »am Fischen« und »nicht am 
Fischen« benutzt. Darüber hinaus schlagen Jiang et al. [Jia17] ein partitionier- 
tes Long Short-Term Memory (LSTM) zur punktbasierten binären Klassifikati- 
on von AIS-Trajektorien in Fischerei- oder Nichtfischereiaktivitäten vor. Sie 
evaluieren ihr Modell im Vergleich zu anderen RNNs und erzielen ein signi- 
fikant besseres Ergebnis als übliche wiederkehrende Netzwerkarchitekturen, 
die auf LSTM oder Gated Recurrent Units basieren. 


2.4.2 Kontextuelle Anomalien 


Die bisher gezeigten Ansätze beschränken sich insbesondere auf die Verwen- 
dung der Positions- und Kinematikdaten, um Anomalien zu finden oder Ver- 
halten zu klassifizieren. In den verschiedenen Anwendungsdomänen stehen 
jedoch häufig weitere Informationsquellen zur Verfügung, die bei der Ano- 
maliedetektion als Kontext in solche Klassifikationen einfließen können. 


Liu et al. [Liu14] verfolgen einen Ansatz, der dem von Pallotta et al. ähnelt. Sie 
versuchen dabei jedoch die durch die IMO festgelegten Richtlinien zu berück- 
sichtigen. Außerdem passen Liu et al. den DBSCAN-Algorithmus an, um ex- 
plizit besser mit Kurs- und Geschwindigkeitsinformationen umgehen zu kön- 
nen. Mit ihrem Algorithmus können Liu et al. anormale Muster erkennen. 


In [Abu18] beschreiben Abualhaol et al. eine Möglichkeit, mit Hilfe eines 
LSTM die Abfertigungszeiten (Löschen und Beladen) eines Schiffes im Ha- 
fen zu schätzen. Als Eingang dienen hier AIS-Nachrichten. Außerdem fließen 
Informationen zu den Häfen in die Berechnungen mit ein. Dazu zählt z.B. die 
konvexe Hülle über die Schiffspositionen im Hafengebiet. 
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Akinbulire et al. [Aki17] benutzen einen Reinforcement-Learning-Ansatz, um 
die Verfolgung von Schiffen, die in illegalen Aktivitäten involviert sind, zu pla- 
nen. Um dem großen Aktionsraum beim Reinforcement-Learning entgegenzu- 
wirken, wird ein Fuzzy-Inference-System eingesetzt. 


Vries und Someren [Vri12] verwenden die Methode piecewise linear segmenta- 
tion, um die Trajektorien von Seeschiffen zu komprimieren. Diese kompri- 
mierten Trajektorien werden dann zu Clustern zusammengefasst. Die Erken- 
nung von Anomalien wird mit Hilfe von Kernel-Methoden durchgeführt. Dar- 
über hinaus wird Expertenwissen einbezogen. Die Algorithmen werden mit 
einem Datensatz, der vor der niederländischen Küste bei Rotterdam aufge- 
nommen wurde, validiert. 


Yang et al. [Yan07] beschreiben, wie Agenten in einem Verhandlungsspiel 
Ausweichmanöver von Schiffen optimieren können. Für die Abschätzung des 
optimalen Kurses zur Vermeidung einer Kollision wird ein Verhandlungssys- 
tem verwendet: Jedes Schiff in einer möglichen Kollision wird als Agent mo- 
delliert. Auf der Grundlage eines monotonen Konzessionsprotokolls müssen 
die Agenten Zugeständnisse machen, um eine Einigung zu erzielen. Wenn sie 
sich nicht auf eine Strategie einigen können, wird eine Lösung auf der Grund- 
lage eines anderen Algorithmus verwendet. 


Ein Multiagentensystem (MAS) für die Meeresüberwachung wird von Mano 
et al. [Man10] vorgestellt. Jedes Schiff in einem Gebiet wird von einem indivi- 
duellen Agenten überwacht. Diese Agenten schätzen den Kritikalitätswert für 
das zugewiesene Schiff als eine Kombination verschiedener Regeln in Bezug 
auf den Zustand des Schiffes und das Gebiet um das Schiff herum. Da sich die 
Bedingungen im überwachten Bereich verändern können, ist es als adaptives 
System konzipiert. 


Teske et al. [Tes17] versuchen durch eine Fuzzy-Regelbasis eine Risikoab- 
schätzung abzugeben. Hierbei fließen Informationen zum Wetter, zu mögli- 
chen Kollisionen, dem erwarteten Einfluss eines Vorfalls auf die Umwelt sowie 
Angriffs- und Ereigniswahrscheinlichkeiten ein. 
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Einen gänzlich anderen Ansatz verfolgen Teske et al. in [Tes18]. Sie verwen- 
den Natural-Language-Processing, um Ereignisse basierend auf einer Schlüs- 
selwortliste aus Artikeln zu extrahieren. Hierbei werden Artikel aus unter- 
schiedlichen Zeitungen und Zeitschriften (z. B. »The Maritime Executive« und 
»The New York Times«) verwendet. Im ersten Schritt wird dazu erkannt, ob 
sich ein Artikel tatsächlich mit maritimen Ereignissen befasst. Dafür werden 
die einzelnen Artikel mit Hilfe eines bag-of-words-Models repräsentiert und 
klassifiziert. Im Anschluss werden u.a. auf Basis der Schlüsselwortlisten De- 
tails zum Ereignis extrahiert (z.B. der Ort des Ereignisses). 


2.4.3 Komplexe Anomalien 


Erkennen komplexer Anomalien basiert auf der Identifikation komplexer Ver- 
haltensmuster, die durch den gegebenen Kontext eine Abweichung darstellen. 
DBNs werden von Fischer et al. [Fis14] verwendet, um Situationen von Inter- 
esse, z.B. den Warenschmuggel, zu modellieren. Da ein DBN mehrere Para- 
meter hat, die von Fachkundigen möglicherweise nicht intuitiv ausgewählt 
werden können, haben Fischer et al. einen Ansatz entwickelt, um diese Para- 
meter zu schätzen, indem sie nur einige wenige intuitive Parameter angeben. 


Darüber hinaus stellt Fischer in [Fis16] einen ganzheitlichen Ansatz zur Si- 
tuationsanalyse vor, der auf einem situationsspezifischen DBN basiert. Dies 
beinhaltet sowohl die Modellierung des Netzes als auch die Darstellung ge- 
genüber den Endnutzern/Endnutzerinnen. Wichtig für die Funktionalität sind 
die Fähigkeit des Netzes, das Domänenwissen zu modellieren, und die Be- 
handlung von verrauschten Eingangsdaten. Für die Auswertung werden si- 
mulierte und reale Daten verwendet, um die Erkennungsqualität des Ansat- 
zes zu beurteilen. 


Lane et al. [Lan10] erstellen Bayes’sche Netze, die Kriterien und Merkmale 
von Schiffen kombinieren, um verdächtige Situationen zu erkennen. Die fünf 
Hauptkriterien sind: »Abweichung von den normalen Routen«, »Erkennung 
verdächtiger AIS-Aktivitäten«, »unerwartete Ankunft im Hafen«, »zwei ver- 
dächtig nahe beieinander liegende Schiffe« und »ein Schiff, das in ein be- 
stimmtes Interessengebiet einfährt«. 
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Pilato et al. verwenden in [Pil12] zwei Bayes’sche Netze, um eine Frühwar- 
nung über einen bevorstehenden Piratenangriff zu ermöglichen. Zur Verwal- 
tung des Domänenwissens ist eine maritime Ontologie integriert. Während 
eines der vorgeschlagenen Netze die Möglichkeit bewertet, dass das Schiff ein 
Piratenschiff ist, indem es die Eigenschaften des Schiffes bewertet, schätzt das 
andere Netz den Grad der Bedrohung anhand der Entfernung zwischen den 
Schiffen ab. Die Netz-Parameter werden mit Hilfe von Simulationen ausge- 
wählt. 


Ein komplexes Bayes’sches Netz mit insgesamt vierzig Knoten wird von Krü- 
ger et al. [Krii12] benutzt, um Warenschmuggel im Litoral zu erkennen. Sie 
verwenden kleine Beispiele, um die prinzipielle Funktionsweise des Modells 
zu zeigen, aber es gibt keine Auswertung auf der Grundlage von simulierten 
oder von realen Daten. 


DBNs werden von Dabrowski und Villiers [Dab15] zur Modellierung potenti- 
eller Piratenangriffe verwendet. Die Grundlage des Modells ist ein simulierter 
Piratenangriff, jedoch wird die Validierung mit realen Daten durchgeführt. 


Neben diesen auf probabilistischen graphischen Modellen basierten Ansätzen 
gibt es in der Literatur noch weitere Arbeiten mit dem Ziel, komplexe Ano- 
malien zu erkennen. Brax [Bra11] führt z.B. eine zustandsbasierte Anoma- 
liedetektion mit diskreten Zuständen für Orientierung, Geschwindigkeit, Po- 
sition und relative Position zum nächsten Schiff in Form eines MAS ein. Mit 
diesen Zuständen werden die Wahrscheinlichkeiten für verschiedene Rollen 
in Form von Agenten (z. B. Überfall-Agent, Schmuggler-Agent oder befreun- 
deter Agent) berechnet. Für die Auswertung werden verschiedene Szenarien, 
die bestimmten Situationen ähneln, simulativ generiert und zur Erprobung 
des Ansatzes benutzt. 


Patroumpas et al. [Pat17] verwenden logische Ausdrücke in Form von Event- 
Calculus, um komplexe Ereignisse zu erkennen. Dafür wird Expertenwissen 
bspw. in Form verschiedener geographischer Gebiete mit unterschiedlichen 
Randbedingungen eingeführt. Das System kann dann benutzt werden, um 
Rückschlüsse zu den modellierten Ereignissen zu erhalten. Primeau et al. 
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[Pri17] hingegen verwenden ein Fuzzy-Inferenz-System, um Schmuggelakti- 
vitäten in AIS-Daten zu erkennen. 


2.5 Zusammenfassung 


Für die Bedienung komplexer Systeme ist das mentale Modell des Situati- 
onsbewusstseins von großer Bedeutung. Insbesondere in Systemen, in denen 
Benutzer/-innen kritische Entscheidungen treffen müssen, wie bspw. bei 
Überwachungsaufgaben, ist ein gutes Situationsbewusstsein wichtig, um 
Fehlentscheidungen entgegenzuwirken oder die Konsequenzen zu mindern. 


Eine Möglichkeit, das Situationsbewusstsein zu stärken, ist der Einsatz ge- 
eigneter EUS. Essentieller Teil dieser Systeme ist eine Datenfusion, welche 
die beiden Bereiche »Low-Level Datafusion« und »High-Level Datafusion« 
abdeckt. Nach dem JDL-Modell bezieht sich Ersteres auf die sensornahe Ver- 
arbeitung von Daten, also Merkmalsextraktion, Objekterkennung sowie das 
Nachverfolgen von Objekten. Letzteres nimmt dies als Grundlage, um daraus 
höherwertige Informationen abzuleiten, z.B. über die Existenzwahrschein- 
lichkeit einer Situation. 


Um Inferenzen auf allen vorhandenen Daten zu ermöglichen, werden Welt- 
modelle, wie das OOWM, eingesetzt. Ein Weltmodell soll die reale Welt in ei- 
ner maschinell verwertbaren Repräsentation abbilden. Dabei sollen Informa- 
tionen nur in der benötigten Abstraktionsebene vorgehalten werden. Durch 
domänenspezifisches Wissen kann das Weltmodell weiter angereichert wer- 
den. Für den maritimen Raum kann hierfür auf unterschiedliche Standards 
und Projektergebnisse zurückgegriffen werden. 


Um neben statistischen Ausreißern auch andere Situationen von Interesse er- 
kennen zu können, werden unterschiedliche Verfahren zur Anomaliedetekti- 
on verwendet. Diese setzen auf einem Weltmodell auf und können bestimmte 
Ereignisse erkennen. Daher ist das Zusammenspiel verschiedener Algorith- 
men sinnvoll, um auch komplexere Ereignisse zuverlässig erkennen zu kön- 
nen. 
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3 Allgemeines Vorgehen 


»Der Zufall begiinstigt den vorbereiteten Geist.« 
— Louis Pasteur 


3.1 Forschungsstrategie Design and Create 


Diese Arbeit orientiert sich an der Forschungsstrategie Design and Create nach 
[Oat05, S. 108 ff.]. Diese Forschungsstrategie zählt zu den Design-Science-Re- 
search-Vorgehensmodellen, die in verschiedenen Forschungsprojekten, wie 
durch Indulska und Recker [Ind10] sowie Amrollahi et al. [Amr14] in ihren 
Ubersichtsartikeln gezeigt wird, Verwendung finden. Cater-Steel et al. [Cat19] 
untersuchten die Verwendung dieser Vorgehensmodelle bei (australischen) 
Dissertationen im Bereich der Informationssysteme. Außerdem wurde in den 
Arbeiten von Arnott und Pervan [Arn12, Arn16] gezeigt, dass solche Strate- 
gien vermehrt bei der Entwicklung von EUS Verwendung finden. 


Mit Design and Create wird ein iterativer Problemlösungsansatz bezeichnet, 
der darauf abzielt, Informationstechnik(IT)-Artefakte zu entwickeln und zu 
erforschen. IT-Artefakte sind dabei Methoden, Modelle, Komponenten und 
ganze Systeme. Dabei werden in den Iterationen die folgenden Schritte durch- 
laufen: 


Awareness: Erkennen und Formulieren eines Problems 
Suggestion: Lösungsvorschlag 
Development: Umsetzung mit einer adäquaten Methodik 


Evaluation: Untersuchung des Artefaktes auf den gewünschten Lösungsef- 
fekt und mögliche Abweichungen vom Erwarteten 
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Conclusion: Konsolidierung, Bewertung und Diskussion der Ergebnisse, Er- 


fahrungen und Schlussfolgerungen 


Durch eine Iteration wird mindestens ein IT-Artefakt erzeugt. Jede Iteration 
wird in dieser Arbeit dabei als eigenes Kapitel beschrieben. Die Abschnitte 
dieser Kapitel bilden die Schritte des Design and Create wie folgt und in Ab- 
bildung 3.1 dargestellt ab: 


1 Problem und Zielsetzung > Awareness 
2 Methodik — Suggestion und Development 
3 Ergebnis > Suggestion und Development 


4 Schlussfolgerung — Evaluation und Conclusion 


-> Awareness lain 
“a m Stand der Forschung und Technik 
r Situationsbewusstsein 
r Entscheidungsunterstützung für den maritimen Raum 
i 5 
H Suggestion Umweltmodellierung in der Entscheidungsunterstützung 
K Anomaliedetektion in räumlich-zeitlichen Datensätzen 
1 
i y Allgemeines Vorgehen 
i 
N=7 Development Forschungsstrategie Design and Create 
r Verwendete Datensätze und Aufbereitung der Daten 
i 
\ N Iterationen 
\ Y > Problem und Zielsetzung 
\ 
i Evaluation > Methodik 
` ) F 
\ > Ergebnis 
` 
$ > Schlussfolgerung 
N a Y (Bewertung und Diskussion) 
aa Conclusion Schlussbetrachtung 


Abbildung 3.1: Verknüpfung des Design-and-Create-Ansatzes mit der Struktur dieser Arbeit 


Dabei können aufgrund der Ergebnisse und Schlussfolgerungen einer Iterati- 
on weitere Iterationen entstehen. Dieser Prozess wird so lange durchgeführt, 
bis die Zielsetzung der Arbeit erreicht wird und damit die einzelnen Hypo- 
thesen widerlegt oder bestätigt werden können. In dieser Arbeit werden da- 
zu sieben Iterationen benötigt: In der ersten Iteration wird das OOWM um 
Verhaltensmodelle erweitert und an die maritime Anwendungsdomäne an- 
gepasst. Um abschätzen zu können, inwieweit das Erkennen von Positions- 
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und Kinematik-Anomalien für die Einsatzdomäne ausreichend ist, werden ent- 
sprechende Verfahren in der zweiten Iteration betrachtet. Da diese zwar er- 
folgreich für sehr bestimmte Anomalien eingesetzt werden können, jedoch 
keinen Kontextbezug beinhalten, werden in der dritten und vierten Iteration 
Verfahren behandelt, die es ermöglichen, Expertenwissen einfließen zu lassen. 
Bei dem auf Nutzenfunktionen basierten Verfahren wird dabei das Problem 
identifiziert, ebensolche Nutzenfunktionen sinnvoll und plausibel zu erstel- 
len. In der fünften und sechsten Iteration werden daher zwei Verfahren erar- 
beitet, um datengetrieben Nutzenfunktionen schätzen zu können. Die letzte 
Iteration zeigt ein auf DBNs basiertes Verfahren, um komplexe Situationen 
zu erkennen. 


Iteration 1 
Erweiterung des OOWMs 
um Verhaltensmodelle 


A 


Iteration 2 


Detektion von Positions- 
und kinematischen Anomalien 


¥ 


Iteration 3 
~> Spieltheoretisches 
Verhaltensmodell 


| v y 


Iteration 4 
Iteration 5 Schiffstypklassifikation 


Routenextraktion 


Bestimmen von Nutzenfunktionen 


Iteration 6 


Inverse Reinforcement 


Learning Detektion von 


kontextuellen Anomalien 


Iteration 7 
Detektion von komplexen 
Anomalien 


Abbildung 3.2: Zusammenhang zwischen den Iterationen 
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Der Zusammenhang zwischen den einzelnen Schritten ist in Abbildung 3.2 


dargestellt. Aus den Iterationen entstehen in dieser Arbeit die folgenden Ar- 


tefakte als Beitrag zur Wissenschaft: 
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Das Umweltmodell OOWM wurde um Verhaltensmodelle erweitert, 
die es ermöglichen, Verhaltensmuster als weitere Komponente in der 
Verarbeitungskette einfließen zu lassen. 


Gestützt auf die Schätzung der Wahrscheinlichkeitsdichte der Position 
und Kinematik von realen Verkehrsdaten werden Positions- und 
kinematische Anomalien erkannt. 


Die Position und Kinematik über die Gesamttrajektorie werden durch 
B-Splines approximiert und zur Erkennung von Anomalien genutzt. 


Durch Integration von Kontextinformationen und die im erweiterten 
OOWM vorgehaltenen Verhaltensmodelle werden kontextuelle 
Anomalien erkannt. 


Auf Basis der Verkehrsdaten als Zeitreihenanalyse der einzelnen 
Schiffe wird eine Schiffstypklassifikation ermöglicht. Diese basiert auf 
einem Convolutional Neural Network (CNN). 


Zur Verwendung von festen Reiserouten als Kontextwissen werden 
Repräsentationen dieser Routen eingelernt. 


Um weniger klare neue Verhaltensmuster bestimmen zu können, wird 
mit Hilfe eines Inverse-Reinforcement-Learning- Ansatzes die 
Nutzenfunktion zur weiteren Verwendung in Verhaltensmodellen 
geschätzt. 


Um bestimmte komplexe Situationen von Interesse erkennen zu 
können, wird ein auf DBNs basierter Ansatz eingesetzt, der es 
ermöglicht, die unterschiedliche Zuverlässigkeit von 
Informationsquellen einfließen zu lassen. 


3.2 Verwendete Datensätze und Aufbereitung der Daten 


3.2 Verwendete Datensätze und Aufbereitung 
der Daten 


Um zu gewährleisten, dass die unterschiedlichen Verfahren in realen Einsatz- 
szenarien funktionieren, werden die einzelnen Artefakte unter Verwendung 
von realen Daten erprobt. Die verwendeten Daten stammen dabei aus vier 
verschiedenen Datensätzen, die in dieser Arbeit wie folgt bezeichnet werden: 


IOSB-Western-Baltic-Sea: AIS-Daten über eine Woche in einem Gebiet, das 
aus dem westlichen Teil der Ostsee, dem Kattegat, Teilen des Skager- 
rak und der Beltsee besteht. 


IOSB-AISHub: AIS-Daten basierend auf AISHub'. AISHub ist ein Dienst zum 
Austausch von AIS-Daten. Benutzer/-innen können ihre Daten in das 
System einspeisen und damit anderen zur Verfügung stellen. Damit er- 
gibt sich theoretisch eine weltweite Abdeckung. 


Naval-Academy-Brest: Sechsmonatiger öffentlicher Datensatz um Brest, 
Frankreich [Ray18]. 


MARISA-North-Sea-Live-Trial: IVEF-Daten während des MARISA Live Trials 
in der Nordsee vor der Küste der Niederlande. 


Die Abdeckungsbereiche der Datensätze IOSB-Western-Baltic-Sea, Naval-Aca- 
demy-Brest und MARISA-North-Sea-Live-Trial sind in Abbildung 3.3 darge- 
stellt. Genauere Informationen zu der Anzahl an Datenpunkten, der Anzahl 
an Schiffen sowie dem jeweiligen Zeitraum sind in Tabelle 3.1 für alle Daten- 
sätze zusammengefasst. 


* https://www.aishub.net, letzter Abruf am 04.03.2020. 
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Tabelle 3.1: Details zu den verwendeten Datensätzen. Neben dem Zeitraum der Aufnahme 
werden zusätzlich die Anzahl der Datenpunkte sowie die Anzahl der eindeutigen 
Schiffskennungen gegeben durch die MMSI aufgezeigt. 


Name Zeitraum Datenpunkte MMSIs 
TOSB-Western-Baltic-Sea 16.05.2011-22.05.2011 >2,3 Mio. 3550 

TOSB-AISHub 24.07.2018-15.11.2018 >2,1 Mrd. 209 536 
Naval-Academy-Brest 01.10.2015-31.03.2016 >19 Mio. 4842 
me ae 13.09.2018 13:00-17:00 >70 Tsd.* 713* 


* basierend auf AISHub-Daten im Zeitraum der Versuche 
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Abbildung 3.3: Abdeckungsbereiche verwendeter Datensätze 
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3.2 Verwendete Datensätze und Aufbereitung der Daten 


3.2.1 IOSB-Western-Baltic-Sea 


In Abbildung 3.4 ist eine Heatmap dargestellt, die das Verkehrsaufkommen im 
Gebiet des IOSB-Western-Baltic-Sea-Datensatzes widerspiegelt. In der Heat- 
map wurden drei Teilgebiete gekennzeichnet. Diese drei Gebiete werden in 
Kapitel 5 als Grundlage zum Erstellen der Detektionsverfahren für Positions- 
und kinematische Anomalien genutzt. In der Heatmap sind die verschiedenen 
Schifffahrtswege in der Ostsee klar zu erkennen. 


Zunächst werden die Daten bereinigt und Datenpunkte mit falschen Anga- 
ben sowie alle Daten, die durch Off-Shore-Anlagen und andere fest installier- 
te Systeme wie Navigationshilfen generiert wurden, entfernt. Die Daten der 
resultierenden 3550 eindeutigen Schiffe werden nach ihrer MMSI gruppiert 
und zu Trajektorien verbunden. Wenn die Zeit zwischen zwei Datenpunkten 
größer als 30 Minuten ist, wird die Trajektorie an dieser Stelle geteilt. Insge- 
samt befinden sich so 25 918 unterschiedliche Trajektorien im Datensatz. 


Für die weiteren Untersuchungen werden nur Tanker und Frachtschiffe ana- 
lysiert, da diese durch wirtschaftliche Bedenken klare Fahrmuster aufweisen 
und sich dabei zueinander ähnlich verhalten. Im Datensatz befinden sich 1 087 
Frachtschiffe und 386 Tanker. 


Um eine quantitative Analyse von Anomaliedetektionsverfahren zu ermögli- 
chen und damit im Gegensatz zu anderen Arbeiten (bspw. [Lax11]) das Erken- 
nen von realen Anomalien zu erproben, werden drei Teilbereiche annotiert. In 
den jeweiligen Bereichen werden Positions-, Geschwindigkeits- und Kursano- 
malien markiert. Andere fehlerhafte Angaben in bestimmten Datenfeldern der 
AIS-Nachrichten, z.B. wird im Navigationsstatus-Feld »Vor Anker« angege- 
ben, obwohl sich das Schiff mit mehr als zehn Knoten bewegt, werden für die 
Annotation nicht weiter betrachtet. 
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Abbildung 3.4: Heatmap des Schifffahrtsverkehrs im JOSB-Western-Baltic-Sea-Datensatz. Die 
Daten wurden in einem 0,014°-Raster fiir Langen- und Breitengrad ausgewer- 
tet. Fiir die Experimente aufbereitete Teilgebiete sind farblich markiert. 


Die Annotation der Daten wird insgesamt fiir die drei in Abbildung 3.4 darge- 
stellten Gebiete durchgeführt. Alle Trajektorien der Tanker und Frachtschiffe 
innerhalb dieser Gebiete sind in Abbildung 3.5 zu sehen. Die Gebiete werden 
jeweils ausgewählt, um bestimmte Verhaltensmuster aufzuzeigen. In Abbil- 
dung 3.5a ist ein Teil des Kattegats dargestellt. In diesem Gebiet gibt es keine 
Häfen, die von Tankern oder Frachtschiffen im Datensatz angelaufen würden. 
Wegen der vielen Untiefen um die beiden größeren Inseln (im Norden Læsø 
und im Süden Anholt) gibt es nur wenige Schifffahrtswege. Auf diesen ver- 
kehren die meisten Schiffe. Diese Routen verlaufen von Nord nach Süd oder 
umgekehrt. Häfen auf den beiden Inseln sind mit roten Punkten markiert. 
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Schiffe, die von West nach Ost fahren, werden als Anomalie betrachtet. Ins- 
gesamt gibt es in diesem Gebiet 516 verschiedene Tanker und Frachtschiffe 
mit 30531 Datenpunkten. 


—— aufgezeichnete Trajektorien 
e Häfen 


(b) Baltic Sea 


= 
—— aufgezeichnete Trajektorien 
Ne e Häfen 


—— aufgezeichnete Trajektorien 
e Häfen 


(a) Kattegat 


(c) Fehmarn 


Abbildung 3.5: Trajektorien in den ausgewählten Gebieten 


Abbildung 3.5b zeigt das normale Verhalten innerhalb eines Ausschnitts der 
Ostsee. Dieses Gebiet besteht aus zwei Hauptverkehrsrouten. Im Osten (nord- 
westlich der dänischen Insel Bornholm) beginnen beide Routen. Eine Route 
verläuft in Richtung Kopenhagen, die andere in Richtung Fehmarn und Lol- 
land. Außerdem sind im Norden die Trajektorien von Schiffen zu sehen, die 
den Hafen von Trelleborg anlaufen. Da die Verkehrsdichte der anderen mög- 
lichen Trajektorien (z.B. der Verkehr nach Ystad) gering ist, wird der übrige 
Verkehr als anormales Verhalten definiert. Das daraus resultierende Gebiet hat 
698 eindeutige Tanker und Frachtschiffe, die insgesamt 26 808 Datenpunkte 
generieren. 
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Abbildung 3.5c zeigt ein Gebiet zwischen Fehmarn und Lolland, in dem die 
Situation sich im Vergleich zu den anderen beiden Gebieten komplexer dar- 
stellt. Es gibt eine Fahrverbindung zwischen den Inseln Fehmarn und Lolland. 
Außerdem existieren Routen in beide Richtungen von West nach Ost und von 
Ost nach West. Im Westen teilen sich diese Routen in zwei Abschnitte für jede 
Richtung, einen in Richtung Norden und einen in Richtung Westen, auf. Alle 
Schiffe, die aus dem Süden kommen, werden als Anomalien gekennzeichnet, 
auch wenn es sich bei einigen von ihnen um normalen Verkehr handelt, der 
Häfen in Rostock oder anderen deutschen Städten anläuft. Aufgrund der ge- 
ringen Anzahl von Schiffen, die diesen Weg nehmen, können normaler und 
anomaler Verkehr nicht einwandfrei unterschieden werden. Daher werden die 
Trajektorien als Anomalien gekennzeichnet. Darüber hinaus gibt es mehrere 
Häfen (in Abbildung 3.5c als rote Punkte markiert), die von den ausgewähl- 
ten Schiffen in diesem Gebiet angelaufen werden. Insgesamt liegen in diesem 
Teil des Datensatzes 602 eindeutige Tanker und Frachtschiffe mit 36 069 Da- 
tenpunkten vor. 


Da das Verhalten auf hoher See und nicht in Häfen betrachtet wird, werden 
während der Annotation der Tanker und Frachtschiffe in den ausgewiesenen 
Gebieten ebensolche Schiffe in Häfen aus dem Datensatz entfernt. Insgesamt 
haben sich für die beiden Schiffstypen anormale Datenpunkte wie in Tabel- 
le 3.2 gezeigt ergeben. Für das Gebiet Fehmarn werden 15,1 % der Datenpunkte 
von Frachtschiffen und 8,7 % der Datenpunkte von Tankschiffen als anormal 
markiert. Im Kattegat-Gebiet sind es 5,4% bzw. 6,6% und im Baltic-Sea-Ge- 
biet 15,2 % bzw. 14,4% der Daten. 


Tabelle 3.2: Annotierte Anomalien in den Teilgebieten 


Gebiet Tanker Frachtschiffe Gesamt 
Fehmarn 852(8.7%) 3972 (15.1%) 4824 (13.4%) 
Kattegat 515 (5.4%) 1391 (6.6 %) 1906 (6.2%) 
Baltic Sea 867 (14.4%) 3149 (15.2%) 4016 (15.0%) 
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3.2.2 IOSB-AISHub 


In Abbildung 3.6 ist eine Heatmap der IOSB-AISHub-Daten zu sehen. Die Ab- 
deckung um Europa ist von guter Qualität, jedoch nicht ganz lückenlos (z.B. 
fehlen die Verbindungen zwischen Island sowie Kontinentaleuropa und die 
Verläufe des Rheins und der Donau sind nicht vollständig), wohingegen ande- 
re Teile der Welt (z.B. Südamerika oder allgemein die hohe See) nur unzurei- 
chend aufgezeichnet werden. Diese Lücken im Empfangsbereich resultieren 
durch den landseitigen Empfang der einzelnen Stationen (im Gegensatz zu 
satellitengestützten Empfangsstationen) und die auf Freiwillige angewiesene 
Einspeisung der Signale. 


Anzahl Schiffe 


10° 


Abbildung 3.6: Heatmap der IOSB-AISHub-Daten. Die Daten wurden im Zeitraum vom 
24.07.2018 bis zum 15.11.2018 aufgezeichnet und in einem 0,1°-Raster für 
Längen- und Breitengrad ausgewertet. Generell entsprechen Linien auf den Kon- 
tinenten entweder Flüssen oder Seen. Da die verwendeten Rohdaten auch feh- 
lerhafte Positionsangaben beinhalten, entstehen Fragmente in Form von Linien 
über einen Breiten- oder Längengrad. Dies ist u. a. sichtbar am Äquator und am 
Nullmeridian. 
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3.2.3 Naval-Academy-Brest 


In Abbildung 3.7a ist eine Heatmap der Daten aus dem Naval-Academy-Brest- 
Datensatz [Ray18] zu sehen. Die Daten werden bereinigt zur Verfügung ge- 
stellt. Da die Daten nur durch einen AIS-Empfänger aufgenommen wurden, 
ist der erfasste Bereich eingeschränkt. In dem Datensatz sind verschiedene 
andere Informationen zusammengefasst. Dazu gehören z.B. die geschätzte 
Fischereidichte in Abbildung 3.7b oder Wetterdaten über den ausgewerte- 
ten Zeitraum. Die Fischereidichtekarte basiert auf einer Auswertung von AIS- 
Nachrichten über einen Zeitraum von einem Jahr [Nat15, Ves16]. Zur Erstel- 
lung dieser Dichtekarte wurden nur Daten zu Trawlern, also Schleppnetzfi- 
schern, verwendet, die tatsächlich am Fischen waren und deren Schiffslänge 
mindestens 15m betrug. 
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10° 


(a) Heatmap des Schiffsverkehrs ausgewertet (b) Geschätzte Fischereidichte auf Basis von 
in einem 0,005°-Raster für Längen- und [Nat15, Ves16] 
Breitengrad 


Abbildung 3.7: Naval-Academy-Brest-Datensatz 


3.2.4 MARISA-North-Sea-Live-Trial 


Die betrachtete Region aus einem der Live Trials im Projekt MARISA, wel- 
cher vor der niederländischen Küste stattfand, ist in Abbildung 3.8 dargestellt. 
Die Versuche wurden im eingezeichneten Gebiet vor der Westfriesischen Insel 
Terschelling durchgeführt. Basis für die Abbildung sind Verkehrsdaten über 
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einen Monat im eingezeichneten Gebiet. Zum einen sind die Seewege im Nor- 
den und Westen, die durch Verkehrstrennungsgebiete vorgegeben sind, klar 
zu erkennen. Zum anderen sind im Bereich des Wattenmeers zwischen dem 
Festland und den Westfriesischen Inseln die durch die Wassertiefe vorgege- 
benen Fahrverläufe deutlich zu identifizieren. 


= F 
mm Versuchsgebiet f 


f 


10? 


10? 


Anzahl Schiffe 


10! 


10° 
Abbildung 3.8: Heatmap im Bereich der MARISA-North-Sea-Live-Trial-Daten. Für die Heatmap 


wurden AIS-Daten aus dem AISHub aus dem Monat August 2018 verwendet und 
in einem 0,001°-Raster für Längen- und Breitengrad ausgewertet. 
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4 Erweiterung des OOWM um 
Verhaltensmodelle 


»Nichts ist verblüffender als die einfache Wahrheit, nichts ist 
exotischer als unsere Umwelt, nichts ist phantasievoller als die 
Sachlichkeit.« 


— Egon Erwin Kisch 


Ergebnisse aus diesem Kapitel wurden im Rahmen des »2018 Joint Workshop 
of Fraunhofer IOSB and Institute for Anthropomatics, Vision and Fusion La- 
boratory« [Ann19a] vorgestellt. 


4.1 Problem und Zielsetzung 


Um Situationen von Interesse identifizieren zu können, sind das Verhalten und 
die Interaktion zwischen den Entitäten von großer Bedeutung. Das OOWM, 
wie es in Abschnitt 2.3.3 eingeführt wurde, lässt dies jedoch außer Acht. Die 
Entitäten € besitzen hier also kein distinktives Verhaltensmuster. Das Inte- 
grieren dieser Verhaltensmuster kann die Bewertung einer Situation stark be- 
einflussen, da dieses eine Erklärung für Verhalten liefern kann, das auf den 
ersten Blick unregelmäßig erscheint. Das Ziel ist hier also die Erarbeitung 
von Möglichkeiten zur Modellierung und Integration des Verhaltens für das 
OOWM. Außerdem soll gezeigt werden, wie das erweiterte OOWM an die 
maritime Anwendungsdomäne angepasst werden kann. 
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4.2 Methodik 


Im Folgenden wird beschrieben, wie das OOWM um Verhaltensmodelle er- 
weitert werden kann. Dabei werden die Entitäten, für die ein Verhalten mo- 
delliert werden soll, als Agenten interpretiert. Diese Agenten können mit der 
Umwelt und anderen Agenten interagieren. Die Entscheidungen für (rationa- 
le) Aktionen können durch spieltheoretische Überlegungen hergeleitet wer- 
den. 


4.2.1 Erweiterung des OOWM durch Agenten 


Nicht alle Entitäten (z.B. leblose Entitäten wie Mauern, Stühle, Tassen etc.) 
weisen ein dediziertes Verhalten auf, das intern auf Entscheidungsfindungs- 
prozessen aufbaut. Ein abstrahiertes Modell zur Entscheidungsfindung ist ein 
Agentenmodell, das bspw. von Russell und Norvig wie folgt beschrieben wird: 


»An agent is anything that can be viewed as perceiving its en- 
vironment through sensors and acting upon that environment 
through effectors.« [Rus10, S. 34] 


In Abbildung 4.1 ist der Aufbau eines solchen Agenten zu sehen. Dieser Agent 
nimmt seine Umgebung durch Sensoren wahr. Angewendet auf das OOWM 
bedeutet dies, dass jeder Agent eine Untermenge aller Entitäten erkennen 


Agent 


Sensoren 


Aktuatoren 


Abbildung 4.1: Ein intelligenter Agent nach [Rus10, S. 35] 
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kann und diese in Repräsentanten RP C R für seine eigene Umgebungs- 
modellierung vorhält. Weiterhin kann ein Agent Aktionen B mit seinen Ak- 
tuatoren ausführen. Diese können die Umwelt beeinflussen. Für die Reprä- 
sentanten im OOWM heißt dies, dass durch eine Aktion Attribute verändert 
werden. Ein intelligenter Agent wird einen Mechanismus zur Entscheidungs- 
findung - basierend auf seiner wahrgenommenen Umgebung - benutzen, um 
die nächste Aktion festzulegen. Russell und Norvig sprechen hier von einem 
idealen rationalen Agenten: 


»For each possible percept sequence, an ideal rational agent 
should do whatever action is expected to maximize its perfor- 
mance measure, on the basis of evidence provided by the per- 
cept sequence and whatever built-in knowledge the agent has.« 
[Rus10, S. 37] 


Für die Ausprägung eines Verhaltens kann dieser Ansatz analog der Formali- 
sierung einer Situation wie folgt beschrieben werden: Für die Beobachtungen 
durch eine Entität E ergibt sich der folgende Zustandsraum: 


Qg = xX (R, CR) xT. (4.1) 
RER" 


Dabei ist R” C RP die Menge aller beobachteten Repräsentanten, die rele- 
vant für den Entscheidungsprozess sind. Des Weiteren werden die relevanten 
Konzepte für den Repräsentanten R mit CR bezeichnet. 


Das Verhalten H eines Agenten über ein Zeitintervall d = (t},...,t,) kann 
dann als Abbildung des Zustandsraums Qp auf eine Aktion B € B angese- 
hen werden: 


k 
H: X Qr >B. (4.2) 
i=1 


Die Menge der möglichen Abbildungen zum Generieren von Aktionen wird 
mit H bezeichnet. 
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Dies impliziert, dass ein Teil der Repräsentanten im OOWM sich wie rationa- 
le Agenten verhalten. Dieses Verhalten wird bei ähnlichen Entitäten nur ge- 
ringfügig unterschiedlich ausfallen. Das Hintergrundwissen muss daher um 
Verhaltensmodelle ergänzt werden. Verhalten im OOWM kann als Menge 
der möglichen Verhaltensabbildungen H aufgefasst werden. Ein Repräsen- 
tant folgt einem bestimmten Verhalten H € H basierend auf dem zugehö- 
rigen Konzept C. 


Die Assoziation zwischen dem Verhalten H und einem Repräsentanten R kann 


durch 
P(A | C),VH € H,VC € C, mit P(C | R) > 0 (4.3) 


beschrieben werden. 


Diese Definition erlaubt es jedem Repräsentanten, einem Verhalten zu folgen, 
das auf den assoziierten Konzepten basiert. Im nächsten Schritt wird darge- 
stellt, wie das Verhalten als Entscheidungsfindung modelliert werden kann, 
welche die zur Verfügung stehenden Informationen beachtet. 


4.2.2 Verhaltensmodelle im OOWM 


Nach Russell und Norvig [Rus10, S. 46 ff.] gibt es eine Vielzahl an unterschied- 
lichen Modellen für die Entscheidungsfindung von Agenten. Eines dieser Mo- 
delle ist der nutzenbasierte Agent (engl. »utility-based agent«), dessen Aufbau 
in Abbildung 4.2 dargestellt ist. Ein solcher Agent nimmt seine Umwelt durch 
Sensoren wahr und erstellt mit diesen Informationen eine Repräsentation der 
Welt. Er ist ferner dazu in der Lage, den Einfluss seiner Aktionen auf die Um- 
welt abzuschätzen, um darauf basierend seinen eigenen Nutzen für bestimm- 
te Aktionen zu bestimmen. Der Agent wird dann die Aktion auswählen, die 
bspw. den eigenen Nutzen maximiert oder andere Zielkriterien erfüllt. Diese 
Aktion wird darauf durch die Aktuatoren ausgeführt. 
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Abbildung 4.2: Aufbau eines nutzenbasierten Agenten nach [Rus10, S. 54] 


Ein weiteres Konzept wurde bspw. von Rao und Georgeff [Rao95] als BDI- 
Agent eingeführt. BDI steht als Akronym für Belief, Desire und Intention. Mit 
Belief wird das beobachtbare Wissen über die Welt und sich selbst bezeichnet. 
Desire steht für den Zustand der Welt, der das Problem löst. Als Intention wer- 
den die möglichen Pläne zur Erreichung des Ziels beschrieben. Eine Erweite- 
rung dieses Modells wurde in [Bro01] vorgestellt. Hierbei wird das Modell um 
»Obligations« (dt. »Pflichten« oder »Verbindlichkeiten«) ergänzt. Diese stel- 
len Werte, Normen und Regeln dar, die auf alle Agenten angewandt werden. 


Während diese Modelle generelle Konzepte zur Entscheidungsfindung von 
Agenten beschreiben, ist nicht klar, wie ein Ziel definiert wird oder in welcher 
Form die Aktion tatsächlich ausgewählt wird. Ohne ein genaues Ziel zu ver- 
folgen, ist es aber kaum möglich, eine geeignete Aktion auszuwählen, da im 
Prinzip alle Aktionen in Ordnung wären. Eine bekannte Formulierung dieses 
Problems findet sich in dem Roman »Alice im Wunderland« von Lewis Caroll: 


»[Alice:] »Would you tell me, please, which way I ought to walk 
from here’ 


>That depends a good deal on where you want to get to,< said the 
[Cheshire] Cat. 
>I don’t much care where—< said Alice. 
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>Then it doesn’t matter which way you walk,< said the Cat. 

> —so long as I get somewhere,< Alice added as an explanation. 
>Oh, you’re sure to do that,< said the Cat, >if you only walk long 
enough.<« [Car65, Kapitel 6] 


Es zeigt sich, dass ohne ein valides Ziel keine richtige Entscheidung getroffen 
werden kann, denn jede Entscheidung ist in diesem Fall in Ordnung. Möglich- 
keiten zur Modellierung von Entscheidungsfindungsprozessen sowie Zielde- 
finitionen finden sich in der Entscheidungstheorie und der Spieltheorie. 


Die Entscheidungstheorie beschäftigt sich mit der Analyse von Entscheidun- 
gen von Agenten. Sie spaltet sich in zwei Bereiche auf - normative (präskrip- 
tive) und deskriptive Entscheidungstheorie: 


»Ziel der deskriptiven Entscheidungstheorie ist es zu be- 
schreiben, wie Entscheidungen in der Realität getroffen werden. 
Hierzu sind empirisch gehaltvolle Hypothesen über das Ver- 
halten von Individuen und Gruppen im Entscheidungsprozess 
zu entwickeln, mit deren Hilfe Entscheidungen prognostiziert 
werden können. 

Ziel der präskriptiven (oder normativen) Entscheidungstheo- 
rie ist es zu zeigen, wie Entscheidungen >rational< getroffen 
werden können. Hierzu werden Grundprobleme der Auswahl 
aus mehreren einander ausschließenden Handlungsalternativen 
untersucht, die in allen oder zumindest in zahlreichen Entschei- 
dungssituationen entstehen. Dabei stehen Entscheidungen im 
Vordergrund, die im Hinblick auf mehrere zueinander in Konflikt 
stehende Ziele und angesichts einer ungewissen Zukunft zu 
treffen sind.« [Lau18, S. 28] 


Grundlage sind hier immer Entscheidungssituationen mit nur einem Agen- 
ten. Entscheidungssituationen mit mehreren Agenten, bei denen sich die Ent- 
scheidungen der einzelnen Agenten gegenseitig beeinflussen, werden in der 
Spieltheorie betrachtet. 


Die Spieltheorie behandelt Konflikte und Kooperationen zwischen intelligen- 
ten rationalen Entscheidern in Form von mathematischen Modellen. Nach 
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Holler et al. [Hol19, S. 1] sind vier Charakteristika entscheidend für die be- 
trachtete strategische Entscheidungssituation: 


« Eine Entscheidung hängt von mehreren Entscheidern ab, das Ergebnis 
ist also nicht unabhängig von der Wahl der anderen. 


« Den Entscheidern ist diese Abhängigkeit bekannt. 


« Jeder Entscheider geht davon aus, dass diese Abhängigkeit jedem 
anderen Entscheider auch bekannt ist. 


e Entscheider berücksichtigen die vorherigen drei Punkte bei der 
Entscheidungsfindung. 


Die Spieltheorie behandelt die aus diesen Punkten entstehenden Interessens- 
konflikte und/oder Koordinationsprobleme und liefert dafür Hilfsmittel, um 
ebendiese analysieren zu können. Dazu gibt die Spieltheorie den formalen 
Rahmen, um Erwartungen zum Verhalten anderer und deren Entscheidungen 
sowie die Regeln zur Entscheidungsfindung formulieren zu können. 


Ein (nichtkooperatives) Spiel T besteht aus einer Spielermenge JV, eine Menge 
an Strategien BT und einer Nutzenfunktion u: 


T=(N,BT,u). (4.4) 


Ein Repräsentant RE R mit dem Verhalten H kann als Spieler in einem 
spieltheoretischen Spiel I aufgefasst werden. Die Spielermenge ist durch 


N = {1,...,n} (4.5) 


gegeben. Der gesamte Strategieraum baut auf den möglichen Strategien der 
einzelnen Spieler auf: 


n 
Bl = & BT. (4.6) 
i=1 


Eine Strategie BF € BT eines Spielers i € N entspricht nach [Hol19, S. 36] der 
Planung einer bestimmten Folge von Aktionen B; € B;, die der Repräsentant 
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R; durchführen kann. Wird eine einzelne Entscheidungssituation betrachtet, 
fallen die möglichen Strategien und die möglichen Aktionen zusammen. 


Durch die Nutzenfunktion wird allen Spielern für jede Strategiekombination 
ein Nutzen über folgende Abbildung zugeordnet: 


u: B’ > R”. (4.7) 


Zur Auswahl der Strategien werden verschiedene Lösungskonzepte benutzt. 
Ein Überblick wird bspw. in [Hol19, S. 34] gegeben. Eines der bekanntesten 
Lösungskonzepte ist das Nash-Gleichgewicht [Nas51]. Als Grundlage dient 
hier ein nichtkooperatives Spiel I, d.h., ein Agent will seinen eigenen Nut- 
zen maximieren, aber nicht zwangslaufig versuchen, den Nutzen der anderen 
Spieler zu erhöhen. Das Nash-Gleichgewicht gibt in einer solchen Konstella- 
tion vor, wie sich Spieler unter Voraussetzung eines erwarteten Nutzens ra- 
tional verhalten würden. 


Im OOWM wird das Hintergrundwissen in Form von Konzepten hinterlegt. 
Das mögliche Verhalten der Agenten soll sich nach dem assoziierten Konzept 
richten. Ein Formalismus, der diesen Grundgedanken in ähnlicher Weise ver- 
folgt, wurde von Harsanyi [Har68] eingeführt: In einem sogenannten Bayes- 
Spiel wird jedem Spieler ein Typ zugeordnet. Dieser Typ hat direkten Einfluss 
auf den erwarteten Nutzen des Spielers und wird von einem speziellen Spieler 
(im Folgenden »Natur« genannt) am Anfang des Spiels zugewiesen. 


Ein Spiel mit unvollständigen Informationen und Spielertypen wird wie folgt 
definiert: 


IBayes — (N, (F, BI, Ui, Pidiew) : (4.8) 


Die Natur weist hier den Typ fiir die Spieler zufallig zu und ein Spieler kennt 
nur seinen eigenen Typ. Bevor irgendein anderer Spieler eine Aktion durch- 
führt, wählt die Natur also den Spielertyp T; € J für jeden Spieler ie N 
aus. Diese Auswahl wird als sogenannte gemischte Strategie modelliert. Ei- 
ne gemischte Strategie stellt sich als Wahrscheinlichkeitsverteilung über die 
(reinen) Strategien dar. Außerdem gibt p; (Belief) für jeden Spielerie N 
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eine Wahrscheinlichkeitsverteilung über die einzelnen Spielertypen vor. Im 
Vergleich zum allgemeinen Spiel muss die Nutzenfunktion angepasst wer- 
den. Der Typ J eines Spielers i € N beeinflusst seine Präferenzen, d. h., die 
Nutzenfunktion ist nun nicht nur von den Strategien, sondern auch von den 
Spielertypen abhängig: 


u: BxT>R" (4.9) 


Überträgt man die Notation des Bayes-Spiels in das OOWM, ergibt sich fol- 
gende Zuordnung: 


e Spieler entsprechen Repräsentanten: N > R 
« Typen entsprechen Konzepten: J > C 


e Beliefs in die Typen werden als Wahrscheinlichkeitsverteilung über 
die zugewiesenen Konzepte für jeden Repräsentanten modelliert: 
Pi > P(C | R) fir RE RP. 


4.2.3 Modellierung der Anomaliedetektion im OOWM 


Im Folgenden wird aufgezeigt, wie mit Hilfe des erweiterten OOWMs die 
Anomaliedetektion modelliert werden kann. Wie zuvor dargestellt handelt 
es sich bei R um die Repräsentanten der Entitäten € der realen Welt. Ein Be- 
obachter ist verantwortlich für das Erkennen der markanten oder kritischen 
Situationen. 


Dieser Beobachter kann wiederum als eine Entitat aufgefasst werden: Eg € £. 
Der dazugehörige Repräsentant ist dann durch Ro E R gegeben. Jeder Beob- 
achter für sich hat sein eigenes Hintergrundwissen bestehend aus Konzepten 
Co und Verhaltensmodellen Ho. Der Beobachter kann durch seine eigene 
Sensorik eine Teilmenge der Repräsentanten wahrnehmen: RE CR. 


Jeder beobachtete Repräsentant R € RE wird seine eigenen Aktionen Br € 
Br auf Basis der von ihm selbst wahrgenommenen Repräsentanten RR C R, 
Konzepte Cp und Verhaltensmodelle Hpg ausführen. 
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Ein Beobachter wiederum wird seine Erwartungen beziiglich des Verhaltens 
der Repräsentanten RD davon abhängig machen, welches Hintergrundwis- 
sen Fo er zu Verhaltensmodellen hat und welche Repräsentanten überhaupt 
von ihm wahrgenommen werden. Die Entitäten der realen Welt werden ihr 
Verhalten H von ihren eigenen Beobachtungen abhängig machen. Wenn der 
Beobachter alle relevanten Teile der Weltin Form von Repräsentanten vorhält, 
sollten das tatsächliche Verhalten und das erwartete Verhalten nahezu iden- 
tisch sein. Sie werden voneinander abweichen, wenn die Konzepte C, das Ver- 
halten H oder die beobachteten Repräsentanten RE nicht übereinstimmen. 


Ein Vergleich des erwarteten Verhaltens mit dem beobachteten ermöglicht 
es, eine Aussage über die Wahrscheinlichkeit einer Verhaltensausprägung 
P(Ho | Hr) zu treffen. Informationen über P(Hg | Hr) können dazu benutzt 
werden, die Entitäten und Situationen S € $ miteinander zu verknüpfen: 
Eine Entität, deren Verhalten abweicht, kann als Anomalie gewertet werden, 
während gleichzeitig die Wahrscheinlichkeit für eine illegale Aktivität durch 
das mögliche Verhalten modelliert werden kann. 


4.2.4 Hintergrundwissen auf Basis des CISE- 
Kernvokabulars 


Nach dem CISE-Kernvokabular (siehe Abschnitt 2.2.4), das in EUCISE2020 
entwickelt und bspw. in MARISA als Grundlage für das Datenmodell benutzt 
wurde, ergeben sich für den maritimen Raum wie nachfolgend erläutert Attri- 
bute, Konzepte und Verhaltensmuster. In dem Datenmodell existieren sieben 
Kernentitäten mit zusätzlichen abgeleiteten Entitäten: 


Agent: Beschreibt Personen oder Organisationen (nicht zu verwechseln mit 
einem intelligenten Agenten nach Abbildung 4.1). Abgeleitete Entitä- 
ten: Person, Organization 


Object: Beschreibt Fahrzeuge (Schiffe, Flugzeuge und Landfahrzeuge) oder 
Ladung eines Schiffes. Abgeleitete Entitäten: Vehicle, Vessel, Aircraft, 
LandVehicle, CargoUnit. Als weitere Beschreibung: OperationalAsset 
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Location: Positionsangaben in Form von Ortsnamen, georeferenzierten Geo- 
metrien oder Adressen. Abgeleitete Entitäten: NamedLocation, PortLo- 
cation, PortFacilityLocation. Als weitere Beschreibung: MeteoOceanogra- 
phicCondition 


Document: Dient zum Austausch von Informationen in gängigen digitalen 
Formaten (z.B. Videos kodiert als MPEG-4 H.264). 


Event: Informationen zu Bewegungen, Anomalien, Vorfällen und Aktionen. 
Abgeleitete Entitäten: Movement, Action, Incident, Anomaly 


Risk: Darstellung von möglicherweise gefährlichen Entwicklungen einer Si- 
tuation. 


Period: Darstellung von Zeitintervallen. 


Bei den Entitäten handelt es sich noch nicht direkt um (intelligente) Agenten 
(siehe Abbildung 4.1) mit bestimmten Verhalten, sondern zunächst nur um 
Datenmodelle um die möglichen Attribute für die maritime Anwendungsdo- 
mäne abzuleiten. Diese Kernentitäten, die daraus abgeleiteten Entitäten und 
die jeweiligen Attribute können bis auf Period direkt als Konzepte und Attri- 
bute im OOWM adaptiert werden. Die zeitliche Komponente wird im OOWM 
nicht als Konzept verstanden, sondern als zusätzliche Dimension, die mit den 
Repräsentanten und deren Attributen verknüpft oder als ein Attribut (bspw. 
geplante Ankunftszeit) genutzt wird. Die zeitliche Dimension wurde in Ab- 
schnitt 2.3.3 bspw. zur Definition einer Situation eingeführt. Darauf aufbau- 
end können dann bspw. zur Beschreibung eines Schiffes die Attribute aus der 
Entität Vessel benutzt werden. Zusätzlich kann dann ein Verhalten nach Ab- 
schnitt 4.2.3 betrachtet werden. 


Die durch das CISE-Kernvokabular beschriebenen Entitäten und Attribute 
sind teilweise nicht ausreichend spezifiziert: So gibt es zwar bspw. Entitäten 
für Land- und Luftfahrzeuge (LandVehicle und Aircraft), diese fügen jedoch 
den Entitäten keine für die jeweiligen Domänen spezifischen Attribute hin- 
zu und dienen eher als Platzhalter. Ähnliches gilt für verschiedene Attribute 
der Vessel-Entität: So werden nur neun generelle Schiffstypen unterschieden. 
Daher wurden z.B. im Rahmen des MARISA-Projekts weitere Schiffstypen, 
die durch das AIS vorgegeben werden, hinzugefügt. Um weitere und zum Teil 
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speziellere Anomalien unterscheiden zu können, wurden im Rahmen dieses 
Projekts auch für die Anomaly-Entität weitere Typen hinzugefügt. 


Zum Abbilden von Aktionen und Missionen stehen die Event-Entität und 
die daraus abgeleiteten Entitäten Movement und Action zur Verfügung. Hier- 
bei können bestimmte Missionen, wie »Police activities« oder »Fire Fighting 
missions«, sowie Fahrrouten definiert werden. Eigentliche Verhaltensmodel- 
le, wie zuvor in diesem Kapitel erläutert, können hier nicht direkt hinterlegt 
werden. 


4.3 Ergebnis 


In diesem Kapitel wurde dargestellt, wie das OOWM durch Verhaltensmodelle 
erweitert werden kann. Außerdem wurde gezeigt, wie sich das Verhalten auf 
Basis der für ein Objekt zur Verfügung stehenden Beobachtungen ausprägt, 
um so Abweichungen von dem realen Verhalten als Anomalie erkennen zu 
können. In einem kurzen Vergleich wurde dargelegt, wie das CISE-Kernvoka- 
bular als Grundlage für das Hintergrundwissen im OOWM genutzt werden 
kann. 


4.4 Schlussfolgerungen 


Dieses Gesamtmodell wird im Folgenden als Grundlage für die möglichen Ob- 
jekte, Konzepte und Attribute angepasst an auf die gewählte Anwendungs- 
domäne genutzt. Da die hier getroffenen Annahmen generisch sind, ist eine 
Adaption an andere Anwendungsdomänen möglich. 
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»Nur wer mit geringen Mitteln Großes tut, hat es glücklich ge- 
troffen.« 


— Carl von Clausewitz 


Ergebnisse aus diesem Kapitel wurden im Rahmen der »2015 SAI Intelligent 
Systems Conference (IntelliSys)« [Ann15], im Journal »Intelligent Systems 
and Applications« [Ann16c], auf der »8th International Conference on Agents 
and Artificial Intelligence« [Ann16a] und der »11th Security Research Con- 
ference (Future Security)« [Ann16b] vorgestellt. 


5.1 Problem und Zielsetzung 


Es soll gezeigt werden, welche Möglichkeiten Anomaliedetektionsverfahren 
für Positions- und kinematische Anomalien eröffnen. Insbesondere sollen Vor- 
und Nachteile sowie Verbesserungen und mögliche offene Fragestellungen 
herausgearbeitet werden. 


5.2 Methodik 


Auf Basis einer Schätzung der Wahrscheinlichkeitsdichte der Position, des 
Kurses über Grund und der Geschwindigkeit werden Verfahren untersucht, 
die es ermöglichen, zum einen einzelne Datenpunkte und zum anderen voll- 
ständige beobachtete Trajektorien in Hinblick auf Anomalien zu untersuchen. 
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Um eine quantitative Bewertung der Qualität der Verfahren zu ermöglichen, 
werden Anomalien in den Daten wie in Abschnitt 3.2.1 beschrieben annotiert. 


5.2.1 Verwendete maschinelle Lernverfahren zur 
Anomaliedetektion 


In diesem Kapitel werden vier verschiedene maschinelle Lernverfahren 
verwendet: zur Schätzung der Wahrscheinlichkeitsdichte Gaussian-Mixture- 
Model (GMM) und Kernel-Density-Estimation (KDE); als Klassifikatoren 
Support-Vector-Machine (SVM) und Multilayer-Perceptron (MLP). 


Gaussian-Mixture-Model 


Ein GMM besteht aus n Komponenten. Jede Komponente i ist eine multiva- 
riate Normalverteilung mit dem Mittelwertvektor u; und der Kovarianzmatrix 
%;. Zusammen mit der Gewichtung ¢; bilden sie den Parametersatz 


8; = (di,Mi, Zi). (5.1) 


Die Dimensionen von p; und %; hängen von der Anzahl der beobachteten 
Merkmale k ab. Die gesamte Wahrscheinlichkeitsdichtefunktion ist gegeben 
durch 


f(x) = > Pilg Œ Bi» Zi) (5.2) 
i=1 


mit Dia $; = 1 und der folgenden Wahrscheinlichkeitsdichtefunktion für 
jede Komponente: 


fe(X, Mi Zi) = —— exp (50 -uE X- Pr) . (5.3) 
(27): |; |? 


Um die Parametersätze ©; zu schätzen, wird der Erwartungs-Maximierungs- 
Algorithmus (EM-Algorithmus) verwendet. Die Anzahl der Komponenten 
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n muss hierbei bekannt sein. Weitere Einzelheiten zu GMMs und zum 
EM-Algorithmus werden z.B. in [Bar14] vorgestellt. 


Bei einem GMM handelt es sich um ein unüberwachtes Lernverfahren. Es 
werden daher zum Training keine annotierten Daten benötigt. Ein GMM wird 
aber als Ergebnis keine Klasse ausgeben. Um Anomalien zu bestimmen, wird 
ein Schwellenwert gmin angesetzt. Wenn die ausgewertete Log-Likelihood ei- 
ner neuen Trajektorie unter diesem Schwellenwert liegt, wird die Trajektorie 
als Anomalie markiert. 


Kernel-Density-Estimation 


Eine KDE (dt. Kerndichteschätzung, auch Parzen-Fenster-Methode genannt) 
schätzt die Wahrscheinlichkeitsdichtefunktion eines Datensatzes mit n Da- 
tenpunkten X1, ... , Xn. Jedem Datenpunkt im Datensatz wird ein Kernel K(x) 
mit der Bandbreite h zugewiesen. Dabei wird im Allgemeinen für alle Punkte 
die gleiche Bandbreite gewählt, die von der Dichte der Punkte im Datensatz 
abhängt. Der Kernel selbst muss eine gültige Wahrscheinlichkeitsdichte 
beschreiben. Für einen Punkt x ergibt sich die Wahrscheinlichkeitsdichte- 
funktion als Summe aller Kernel zu 


eee Xx — X; 
f(x) = — 91K ( 7 jr (5.4) 
Eine mögliche Kernelfunktion ist der Gaußkern 


K(x) = on exp (- sxTE“Ix) (5.5) 
(2m) 2/72 


mit der Einheitsmatrix als Kovarianzmatrix X = I,. Der Wert der Bandbrei- 
te hat einen großen Einfluss auf die resultierende Approximation der Wahr- 
scheinlichkeitsdichtefunktion. Bei zu kleiner Bandbreite kommt es zur Über- 
anpassung; ist die gewählte Bandbreite zu groß, resultiert eine Unteranpas- 
sung. Weitere Details zur KDE finden sich bspw. in [Mur12]. 
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Support-Vector-Machine 


Bei einer SVM handelt es sich um einen Klassifikator. Als solcher weist eine 
SVM einem Datenpunkt eine Klasse zu. Dafiir wird die Entscheidungsgrenze 
zwischen den Klassen im Merkmalsraum optimiert. Als Optimierungskriteri- 
um soll der Abstand zwischen dieser Grenze und jedem Datenpunkt in der 
Trainingsmenge so groß wie möglich sein. Sollten die Klassen nicht linear 
trennbar sein - es gibt also keine Hyperebene, die eine Trennung der Klassen 
im Merkmalsraum ermöglicht -, so wird der Kernel-Trick angewendet, um 
eine nichtlineare Klassengrenze zu ermöglichen. Als Kernel wird hier eine ra- 
diale Basisfunktion mit dem Parameter y verwendet. Der Einfluss eines einzel- 
nen Datenpunktes der Trainingsdaten wird durch den Parameter y reguliert. 
Ein hoher Wert für y bedeutet, dass die Trainingsbeispiele nahe beieinander 
liegen müssen, um sich gegenseitig zu beeinflussen. 


Außerdem wird hier eine Soft-Margin-SVM verwendet, die Fehlklassifikatio- 
nen an der Entscheidungsgrenze zulässt. Dafür wird der Regularisierungspa- 
rameter C eingeführt. Dieser balanciert zwischen einer einfachen und glat- 
ten Entscheidungsgrenze und der Fehlklassifikation von Trainingsbeispielen, 
d.h., ein niedriger Wert für C ergibt eine glatte Oberfläche, dagegen wer- 
den bei einem hohen Wert für C möglichst alle Daten korrekt klassifiziert. 
In [Rus10] finden sich weitere Details zum Thema SVM. 


Multilayer-Perceptron 


Bei einem MLP handelt es sich um ein vorwärtsgerichtetes vollständig 
verbundenes künstliches neuronales Netz mit mindestens einer verdeckten 
Schicht. Es gibt also eine Eingabeschicht, eine Ausgabeschicht und dazwi- 
schen mindestens eine verdeckte Schicht an Neuronen, die immer vom 
Eingang zum Ausgang gerichtet miteinander verbunden sind. Neben der 
Netzeingabe, generiert durch die vorgeschalteten Neuronen, wird häufig ein 
als Bias bezeichneter zusätzlicher Eingang für jedes Neuron vorgesehen, um 
eine gewisse Grundanregung zu generieren. 
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Die kiinstlichen Neuronen in den verschiedenen Schichten kénnen jeweils 
unterschiedliche Aktivierungsfunktionen besitzen. Hier wird fiir die Eingan- 
ge eine lineare Abbildung und fiir die anderen Schichten eine Sigmoidfunk- 
tion als Aktivierungsfunktion benutzt. Weitere Informationen zu künstlichen 
neuronalen Netzen können z.B. [Shal4a] entnommen werden. 


5.2.2 B-Spline-Interpolation zur Anomaliedetektion 


Eine von einem Überwachungssystem aufgezeichnete Trajektorie lässt sich 
aufgrund unterschiedlicher Längen, divergierender Abtastraten und einer 
verschiedenen Anzahl von Punkten nicht ohne Weiteres mit einer anderen 
vergleichen. Um mehrere Trajektorien zu vergleichen, wurden in der Literatur 
bereits unterschiedliche Ansätze erprobt: So wird in [Vak12] Dynamic Time- 
Warping (DTW) verwendet, um von Menschen vorgemachte Trajektorien 
durch einen Roboter einlernen zu lassen, und in [Lax11] wird der Hausdorff- 
Abstand genutzt, um zwei Trajektorien miteinander zu vergleichen. In die- 
sem Kapitel wird der Vergleich zwischen Trajektorien ermöglicht, indem sie 
jeweils auf eine bestimmte Anzahl an Parametern abgebildet werden. 


Jede Trajektorie t hat eine spezifische Länge n und besteht aus mehreren 
Punkten p; = (Di, ton Dita) mit i = 1,...,n, wobei Pi jn der Längengrad 
und Pi a: der Breitengrad der Position des i-ten Punktes ist. Die Trajektorie t 
ist damit durch t = {p; | i = 1,...,n} gegeben. Die Idee ist nun, die Anzahl 
der Punkte so zu reduzieren, dass die resultierende Trajektorie z.B. mit Hilfe 
der euklidischen Distanz verglichen werden kann. 


Dafür wird die B-Spline-Interpolation der Trajektorie bestimmt. Eine B- 
Spline-Interpolation verbindet mehrere (kubische) Funktionen, um eine 
gegebene Menge von Punkten zu interpolieren. 


Der geschätzte B-Spline besteht aus kubischen Funktionen mit einer zuvor 
definierten Anzahl von Abschnitten. Somit hat jede Trajektorie die gleiche 
Anzahl von Kontrollpunkten. Wie von [Gal99] beschrieben, wird ein B-Spline 
eindeutig durch seine Kontrollpunkte bestimmt. Daher wird eine Trajektorie 


87 


5 Detektion von Positions- und kinematischen Anomalien 


mit n Punkten auf die Anzahl der Kontrollpunkte ne reduziert, was zu ei- 
nem Merkmalsraum der Dimension 2 - n, (die Kontrollpunkte haben jeweils 
2D-Koordinaten) führt. Die resultierenden Kontrollpunkte werden als Merk- 
malsvektor verwendet, um die maschinellen Lernverfahren zu trainieren. 


Abbildung 5.1 zeigt ein Beispiel für eine B-Spline-Interpolation. Die roten 
Punkte entsprechen aufgezeichneten Daten. Die Idee ist nun, einen B-Spline 
zu finden, der eine gute Approximation der Daten darstellt. Das Ergebnis der 
Interpolation ist durch die grünen Kontrollpunkte und die blaue Linie dar- 
gestellt. 


—® Aufgezeichnete Daten 
— B-spline Interpolation 
-@- Kontrollpunkte 


Abbildung 5.1: Beispiel einer B-Spline-Interpolation 


Um den Grad der Anomalie einer Trajektorie abzuschatzen, muss diese mit 
aufgezeichneten normalen Trajektorien verglichen werden. Mit Hilfe von ma- 
schinellen Lernverfahren werden dafiir Normalmodelle trainiert. Diese Nor- 
malmodelle sind dann dazu in der Lage, Anomalien zu klassifizieren. 


5.2.3 Bewertungsmetriken 


Zum Vergleich der eingesetzten Verfahren sowie zur allgemeinen Bewertung 
der Klassifikationsgüte werden in diesem Kapitel verschiedene Metriken 
benutzt: Genauigkeit (engl. » precision«, auch positiver prädiktiver Wert), Tref- 
ferquote (engl. »recall«, auch Richtig-positiv-Rate oder Sensitivität), F1-Maß, 
Falsch-positiv-Rate sowie die Receiver Operating Characteristic (ROC) und 
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Precision-Recall(PR)-Kurve. Fir alle Ergebnisse in diesem Kapitel gilt, dass die 
Klasse »Anomalie« die Positiv-Klasse darstellt. 


Die einzelnen Metriken sind wie folgt definiert: 


rn RP 
Genauigkeit = RP 4 EP (5.6) 

RP 

T te = ——__ : 
refferquote RP LFN (5.7) 
FI-Maß = 2 Cenaze Trefferquote (5.8) 
Genauigkeit + Trefferquote 
FP 

Falsch-positiv-Rate = 2 ——— 9 
alsch-positiv-Rate P+ (5.9) 


Hierbei stehen RP und RN für die Anzahl der jeweils korrekt klassifizierten 
Positiv- respektive Negativ-Beispiele, FP für die Anzahl solcher, die fälschli- 
cherweise als positiv, und FN für die Anzahl derer, die fälschlicherweise als 
negativ klassifiziert wurden. 


Die Trefferquote beschreibt den Bruchteil der Positiven, die tatsächlich als po- 
sitiv eingestuft werden (echte Positive). Eine geringe Trefferquote bedeutet 
also, dass es viele falsche negative Klassifikationen gibt. Die Genauigkeit be- 
schreibt den Anteil aller positiv klassifizierten Ergebnisse, die tatsächlich po- 
sitiv sind. Eine kleine Genauigkeit entspricht also einer großen Anzahl falsch 
positiv klassifizierter Ergebnisse. Das F1-Maß beschreibt den harmonischen 
Mittelwert aus diesen beiden Metriken. Für einen optimalen Klassifikator soll- 
te der Wert jeweils »1« sein. Die Falsch-positiv-Rate gibt hierbei den Anteil der 
fälschlicherweise als positiv klassifizierten Ergebnisse an und sollte bei einem 
optimalen Klassifikator bei »0« liegen. Details zu den verwendeten Metriken 
können z.B. [Man08] entnommen werden. 


Eine grafische Möglichkeit zur Einschätzung der Leistung eines Klassifika- 
tors ist die ROC-Kurve. Für die ROC-Kurve wird die Richtig-positiv-Rate als 
Ordinate und die Falsch-positiv-Rate als Abszisse eingetragen. Eine Diagonale 
deutet auf einen Zufallsprozess hin. Die ROC-Kurve lässt sich als Area un- 
der Curve (AUC) zusammenfassen, dieses liegt zwischen »0« und »1« (idealer 
Klassifikator). 
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Eine weitere grafische Méglichkeit zur Bewertung von Klassifikatoren bie- 
tet die PR-Kurve. Laut [Sai15] ist die PR-Kurve informativer bei der Bewer- 
tung von binären Klassifikatoren auf Daten mit unausgewogener Klassenver- 
teilung. Nach [Zha09] lasst sich die PR-Kurve als Average Precision (AP) zu- 
sammenfassen. Dies ist der gewichtete Mittelwert der bei unterschiedlichen 
Schwellwerten erreichten Genauigkeit. Hierbei wird das Inkrement der Tref- 
ferquote zum vorherigen Schwellwert als Gewicht verwendet. Für n Schwell- 
werte ergibt sich die AP zu 


n 
AP = > (Trefferquote, — Trefferquote, _,): Genauigkeit,. (5.10) 
k=1 


5.3 Ergebnis 


Für die Auswertung wird jeweils eine zehnfache stratifizierte Kreuzvalidie- 
rung durchgeführt. Dabei wird der Datensatz in zehn Teilmengen aufgeteilt, 
die jeweils einen identischen Anteil an Anomalien wie der Gesamtdatensatz 
enthalten. Wie in [Wit05] oder [McL05] beschrieben, bietet eine zehnfache 
Kreuzvalidierung einen guten Kompromiss zwischen einer »Leave-one-Out«- 
Taktik, bei der jedes Datum eine Teilmenge beschreibt, und einer kleineren 
Anzahl an Teilmengen, z.B. einer zweifachen Kreuzvalidierung, bei der nicht 
genügend Trainingsdaten zur Verfügung stehen. Die Ergebnisse der einzel- 
nen Iterationen werden gemittelt, um so eine zuverlässige Abschätzung der 
Klassifikationsgüte zu erhalten. 


5.3.1 Punktbasierte Anomaliedetektion durch Schätzung 
der Wahrscheinlichkeitsdichte 


Zur Approximation der Wahrscheinlichkeitsdichte für die punktbasierte Ano- 
maliedetektion werden die beiden Verfahren GMM und KDE eingesetzt. Für 
jedes Teilgebiet im Datensatz muss dafür jeweils ein eigenes Modell einge- 
lernt werden. 
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Fir beide Algorithmen wird die Erkennung von anormalem Verhalten wie 
folgt durchgeführt: Zunächst wird das Normalmodell geschätzt, wobei nur 
Daten mit normalem Verhalten verwendet werden. Für jedes Modell wird 
die minimale Log-Likelihood für die Trainingsdaten berechnet. Die Log- 
Likelihood ist der natürliche Logarithmus der Wahrscheinlichkeitsfunktion, 
die als die bedingte Wahrscheinlichkeit dafür definiert ist, dass ein Ergebnis 
durch einen bestimmten Parametersatz erzeugt wird. Dieses Minimum ist 
die Grenze zwischen Normalität und Anomalie. Wenn für das Training nur 
normale Daten verwendet werden, die so vielfältig sind, dass sie zumindest 
dem größten Teil des möglichen normalen Verhaltens ähneln, kann erwartet 
werden, dass anormale Daten eine geringere Log-Likelihood erzeugen. Über 
jeden neuen Datenpunkt wird nun durch Auswertung des normalen Modells 
mit den neuen Daten entschieden. Das Ergebnis ist die Log-Likelihood des 
neuen Datenpunktes. Wenn sie niedriger als die Grenze ist, wird der neue 
Punkt als Anomalie betrachtet. 


Für einen Datenpunkt i ergibt sich ein Merkmalsvektor aus der Position in 
Längen- und Breitengraden sowie dem Geschwindigkeitsvektor, der in seinen 
Breiten- und Längengradanteil aufgeteilt ist, zu X; = (Pat Plon» Viats Vlon)- 
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Abbildung 5.2: Genauigkeit, Trefferquote und F1-Mafs für verschiedene Bandbreiten im Feh- 
marn-Gebiet 
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(b) Fehmarn - GMM 


aM | : m FP 


(c) Kattegat - KDE (d) Kattegat - GMM 


Abbildung 5.3: Ergebnisse im Fehmarn-Gebiet (a,b) und im Kattegat-Gebiet (c,d). In (a, c) sind 
die Ergebnisse für das KDE und in (b, d) für das GMM abgebildet. Die grauen 
Linien entsprechen allen Trajektorien im Datensatz. Für die beiden Algorithmen 
wurden jeweils die gleichen Teilmengen der Kreuzvalidierung verwendet. 


Für die Auswertung werden die optimalen Parameter für beide Verfahren be- 
stimmt. Dafür werden die Metriken Genauigkeit, Trefferquote und F1-Maß je- 
weils bei Variation der zu optimierenden Parameter durch eine Rastersuche 
ermittelt. Als Beispiel sei hier Abbildung 5.2 für die Bestimmung der optima- 
len Bandbreite des KDE-Modells im Fehmarn-Gebiet gegeben. Für das GMM 
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wird mit 600 Komponenten ein gutes Ergebnis über alle Datensätze hinweg 
erzielt. Für die KDE wird die Bandbreite für das Fehmarn-Gebiet auf 0,06, für 
das Kattegat-Gebiet auf 0,09 und für das Baltic-Sea-Gebiet auf 0,085 gesetzt. 


Tabelle 5.1: Ergebnisse der punktbasierten Anomaliedetektion für die unterschiedlichen Metri- 
ken jeweils mit der Standardabweichung über die 10 Teilmengen der Kreuzvalidie- 


rung 
Gebiet Metrik GMM KDE 
Genauigkeit 0,847 + 0,063 0,669 + 0,115 
Trefferquote 0,684 + 0,129 0,528 + 0,159 
Fehmarn 
F1-Maß 0,750 + 0,096 0,581 + 0,139 
Falsch-positiv-Rate 0,019 + 0,010 0,040 + 0,017 
Genauigkeit 0,550 + 0,133 0,518 + 0,218 
Trefferquote 0,555 + 0,059 0,341 + 0,105 
Kattegat 
F1-Maß 0,545 + 0,078 0,389 + 0,114 
Falsch-positiv-Rate 0,034 + 0,016 0,029 + 0,025 
Genauigkeit 0,764 + 0,079 0,646 + 0,076 
Balti Trefferquote 0,701 + 0,064 0,492 + 0,127 
on F1-Maß 0,727 + 0,048 0,545 + 0,087 
Falsch-positiv-Rate 0,040 + 0,019 0,050 + 0,021 


In Abbildung 5.3 sind qualitative Ergebnisse im Fehmarn- und Kattegat-Gebiet 
für die KDE- und GMM-basierten Anomaliedetektoren zu sehen. Der ausge- 
wertete Verkehr wird als graue Linien repräsentiert, wobei dichterer Verkehr 
zu einem dunkleren Grauton führt. Die eingezeichneten Punkte entsprechen 
einigen der getesteten Datenpunkte: Grüne Punkte wurden als richtig Positi- 
ve, blaue als falsch Positive und rote als falsch Negative klassifiziert. Richtig 
Negative, also normale Datenpunkte, die als normal bewertet wurden, sind in 
diesen Abbildungen nicht dargestellt. In den Ergebnisplots für beide Gebiete 
und Verfahren können einige Herausforderungen ausgemacht werden: Wenn 
bspw. die Position, der Kurs und die Geschwindigkeit einer Trajektorie dem 
normalen Verhalten sehr nahe kommen, werden Teile der Trajektorie nicht 
korrekt als Anomalie erkannt. Dies ist insbesondere in Abbildung 5.3a zu se- 
hen. Daten um den Hafen von Lolland werden von beiden Verfahren falsch 
klassifiziert. 
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Dariiber hinaus gibt es viele falsch klassifizierte Anomalien in beiden Gebie- 
ten mit beiden Algorithmen (blaue Punkte). Fiir das KDE treten diese auf dem 
gesamten untersuchten Gebiet auf. 


Zur weiteren Beurteilung der Leistung der Algorithmen werden im Folgenden 
die zuvor eingeführten quantitativen Metriken ausgewertet. Die Ergebnisse 
in Form von Genauigkeit, Trefferquote, F1-Maß und Falsch-positiv-Rate für die 
drei untersuchten Teilgebiete sind in Tabelle 5.1 dargestellt. In den Abbildun- 
gen 5.4 bis 5.6 sind jeweils die ROC- und PR-Kurven für die verschiedenen 
Gebiete und Verfahren dargestellt. 


= 
1.0 1.0 
0.8 0.8 
Teilmenge 0 (AUC = 0.98) Teilmenge 0 (AP = 0.90) 
206 Teilmenge 1 (AUC = 0.96) a Teilmenge 1 (AP = 0.79) 
5 Teilmenge 2 (AUC = 0.97) 5 Teilmenge 2 (AP = 0.88) 
5 Teilmenge 3 (AUC = 0.97) a Teilmenge 3 (AP = 0.85) 
5 Teilmenge 4 (AUC = 0.99) £ Teilmenge 4 (AP = 0.97) 
È 0.4 Teilmenge 5 (AUC = 0.98) 0.4 Teilmenge 5 (AP = 0.90) 
Teilmenge 6 (AUC = 0.98) Teilmenge 6 (AP = 0.91) 
Teilmenge 7 (AUC = 0.97) Teilmenge 7 (AP = 0.89) 
0.2 Teilmenge 8 (AUC = 0.97) 0.2 Teilmenge 8 (AP = 0.86) 
Teilmenge 9 (AUC = 0.74) Teilmenge 9 (AP = 0.58) 
— Mittelwert (AUC = 0.95 + 0.07) — Mittelwert (AP = 0.85 + 0.10) 
0.0 + 1 Standardabweichung 0.0 + 1 Standardabweichung 
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Falsch-positiv-Rate Recall 
(a) ROC-Kurve - GMM (b) PR-Kurve - GMM 
1.0 1.0 
0.8 0.8 
Teilmenge 0 (AUC = 0.86) Teilmenge 0 (AP = 0.67) 
206 Teilmenge 1 (AUC = 0.83) ae Teilmenge 1 (AP = 0.42) 
Ei Teilmenge 2 (AUC = 0.87) 5 Teilmenge 2 (AP = 0.70) 
5 Teilmenge 3 (AUC = 0.89) a Teilmenge 3 (AP = 0.62) 
5 Teilmenge 4 (AUC = 0.96) £ Teilmenge 4 (AP = 0.89) 
È 0.4 Teilmenge 5 (AUC = 0.92) 0.4 Teilmenge 5 (AP = 0.72) 
Teilmenge 6 (AUC = 0.92) Teilmenge 6 (AP = 0.74) 
Teilmenge 7 (AUC = 0.87) Teilmenge 7 (AP = 0.54) 
0.2 Teilmenge 8 (AUC = 0.91) 0.2 Teilmenge 8 (AP = 0.72) 
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— Mittelwert (AUC = 0.88 + 0.04) — Mittelwert (AP = 0.64 + 0.14) 
0.0 + 1 Standardabweichung ote + 1 Standardabweichung 
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 
Falsch-positiv-Rate Recall 


(c) ROC-Kurve - KDE 


(d) PR-Kurve - KDE 


Abbildung 5.4: ROC-und PR-Kurven für die punktbasierte Anomaliedetektion im Fehmarn-Ge- 
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5.3 Ergebnis 


Für die Erkennung der Anomalien funktionieren beide Verfahren nur unzu- 
reichend: Das F1-Maß liegt für die Gebiete Fehmarn, Kattegat und Baltic Sea 
für das GMM bei 0,750, 0,545 und 0,727 und für das KDE bei 0,581, 0,389 und 
0,545. Als harmonisches Mittel zwischen Genauigkeit und Trefferquote fallen 
auch diese Werte unzureichend aus. Es fällt jedoch auf, dass die Falsch-positiv- 
Rate in allen Gebieten (und für alle Algorithmen) gering ausfällt. 


Ähnliches zeigt sich beim Vergleich der ROC- und PR-Kurven in den Abbil- 
dungen 5.4 bis 5.6: Die ROC-Kurven für die jeweiligen Gebiete fallen mit ei- 
ner guten Klassifikationsgüte auf. In den drei Gebieten Fehmarn, Kattegat und 
Baltic Sea erreicht das GMM im Mittelwert eine AUC von 0,95, 0,94 und 0,96, 


1.0 
0.8 
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(c) ROC-Kurve - KDE 


(d) PR-Kurve - KDE 


Abbildung 5.5: ROC- und PR-Kurven für die punktbasierte Anomaliedetektion im Kattegat-Ge- 


biet 
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wohingegen das KDE nur auf Werte von 0,88, 0,86 und 0,88 kommt. Insge- 
samt wiirden diese Kurven aber fiir eine hohe Klassifikationsgiite sprechen. 
Wie bereits weiter oben angedeutet, gibt eine ROC-Kurve die Güte bei schiefer 
Klassenverteilung nur ungenügend wieder. Der Vergleich mit den PR-Kurven 
zeigt hier ein anderes Bild: Das GMM und das KDE erreichen im Fehmarn-Ge- 
biet eine AP von 0,85 bzw. 0,64, im Kattegat-Gebiet von 0,57 bzw. 0,42 und 
im Baltic-Sea-Gebiet von 0,80 bzw. 0,62. Insgesamt fallt also unter diesem 
Kriterium die Klassifikationsgüte schlechter aus. 


Die beiden untersuchten punktbasierten Algorithmen erzeugen eine große 
Anzahl an falsch positiven und falsch negativen Klassifikationen. Für ein EUS 
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Falsch-positiv-Rate 


(c) ROC-Kurve - KDE 


Recall 


(d) PR-Kurve - KDE 


Abbildung 5.6: ROC- und PR-Kurven für die punktbasierte Anomaliedetektion im Baltic-Sea- 
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Gebiet 


5.3 Ergebnis 


ist die Leistung beider Algorithmen allein nicht ausreichend, um einen/eine 
Anwender/-in tatsächlich zu unterstützen. 


Bei einem GMM wird davon ausgegangen, dass die Wahrscheinlichkeitsdichte 
aus einer Überlagerung multivariater Normalverteilungen entsteht. Die echte 
Wahrscheinlichkeitsdichte ist jedoch unbekannt und kann von einer anderen 
Art beschaffen sein. Eine KDE ist in der Lage, eine willkürliche Wahrschein- 
lichkeitsdichte biasfrei zu schätzen, wenn genügend Trainingsdaten verfüg- 
bar sind. Wenn nicht genügend Daten zur Verfügung stehen, kann sich die re- 
sultierende Wahrscheinlichkeitsdichte erheblich von der echten Wahrschein- 
lichkeitsdichte unterscheiden. 


Beide Algorithmen werten jeweils nur einen einzigen Punkt der Trajektorie 
aus. Daher wird nie die Gesamttrajektorie betrachtet. Dies kann dazu führen, 
dass bspw. ein Sachverhalt, wie in Abbildung 5.7 dargestellt, nicht korrekt er- 
kannt wird: Jeder Datenpunkt der orangefarbenen Trajektorie für sich genom- 
men könnte als normales Verhalten erkannt werden, was zu einer Klassifika- 
tion als »normal« für die gesamte Trajektorie führte. Eine solche Anomalie 
kann nur durch Auswertung mehrerer aufeinander folgender Datenpunkte 
einer Trajektorie (oder der Gesamtheit der Trajektorie) zuverlässig erkannt 
werden. 


— Normal 


sone > Anomalie 


Abbildung 5.7: Einschrankung der punktbasierten Anomaliedetektion. Es kreuzen sich zwei 
Routen. Eine Anomalie wird als orange gestrichelte Linie dargestellt. 


5.3.2 Trajektorienbasierte Anomaliedetektion 


Für die trajektorienbasierte Anomaliedetektion wird nur das Gebiet um Feh- 
marn untersucht. Für dieses Teilgebiet genügen vier Kontrollpunkte für die B- 
Spline-Interpolation, um die Trajektorien in ausreichender Genauigkeit ver- 
gleichbar darzustellen. 
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@  Kontrollpunkte 
=== B-Splines 


Abbildung 5.8: B-Spline-Interpolationen aller Trajektorien im Datensatz 


Die B-Splines und Kontrollpunkte sind in Abbildung 5.8 für alle Trajektorien 
dargestellt. Jede blaue Linie stellt eine Trajektorie dar. Zur Durchführung der 
Interpolation muss eine Trajektorie mindestens vier Punkte beinhalten. Bei 
einigen transformierten Trajektorien kann man nun sehen, dass diese über 
Inseln verlaufen. Dies ist ein Ergebnis der Verwendung einer begrenzten An- 
zahl von Kontrollpunkten: Die Interpolation stellt einen geglätteten Verlauf 
dar, daher geht der genaue Verlauf verloren. Die Kontrollpunkte für jede Tra- 
jektorie werden durch grüne Punkte dargestellt. Der erste und der letzte Kon- 
trollpunkt befinden sich am Anfang bzw. am Ende der Trajektorie. Da die 
Trajektorien zum großen Teil eben an den Rändern des Gebietes starten, lie- 
gen dort Ansammlungen an grünen Punkten vor. Darüber hinaus sind weitere 
Cluster grüner Punkte auf dem Bild zu sehen. Vielbefahrene Schifffahrtswege 
können durch vier solcher Cluster dargestellt werden. 


Da jede Trajektorie aus vier 2D-Kontrollpunkten besteht, ergibt sich der 
Merkmalsvektor 


= T 
X = (C1 tone Ci, tats C2; ton» Ca; tat» C3,lon» C3,lat» CA, tons C4, lat) (5.11) 
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als Eingang der evaluierten maschinellen Lernverfahren. Fiir alle maschinel- 


len Lernverfahren wird zur Parametrierung eine Rastersuche durchgeführt. 


Es ergeben sich für das GMM die Anzahl der Komponenten zun = 
die SVM die beiden Parameter C und y zu 10000 respektive 0,1. Der Aufbau 
des MLPs ist in Abbildung 5.9 zu sehen. Es handelt sich dabei um ein Netz mit 
einer verdeckten Schicht mit ny = 25 Neuronen. 


Eingabe- 
schicht 


Cy lat 
Cı,lon 
C2,lat 
C2 lon 
C3 lat 
C3 lon 
C4 lat 


C4,lon 


Verborgene 
Schicht 


Ausgabe- 
schicht 


C> Ausgabe 


Abbildung 5.9: Struktur des verwendeten MLPs ohne die Bias-Eingänge 


30, für 


Die verschiedenen Metriken für die Ergebnisse der trajektorienbasierten Ano- 
maliedetektion sind in Tabelle 5.2 zu finden. In Abbildung 5.10 sind die dazu- 
gehörigen ROC- und PR-Kurven abgebildet. Darüber hinaus sind in Abbil- 
dung 5.11 ausgewählte qualitative Ergebnisse zu einer Teilmenge der Kreuz- 


validierung dargestellt. 


Tabelle 5.2: Ergebnisse der trajektorienbasierten Anomaliedetektion im Fehmarn-Gebiet für die 
unterschiedlichen Metriken jeweils mit der Standardabweichung über die 10 Teil- 
mengen der Kreuzvalidierung 


Metrik GMM SVM MLP 
Genauigkeit 0,780 + 0,101 0,945 + 0,079 0,906 + 0,050 
Trefferquote 0,898 + 0,089 0,746 +0,164 0,885 + 0,107 

F1-Maß 0,832 + 0,085 0,827 +0,129 0,892 + 0,073 

Falsch-positiv-Rate 0,121 + 0,066 0,017 + 0,022 0,042 + 0,027 
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(e) ROC-Kurve - MLP 


(f) PR-Kurve - MLP 


Abbildung 5.10: ROC- und PR-Kurven fiir die trajektorienbasierte Anomaliedetektion 
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(a) Grundwahrheit (b) GMM 


(c) SVM (d) MLP 


Abbildung 5.11: Die Ergebnisse der B-Spline-basierten Anomaliedetektion fiir Tankschiffe und 
Frachtschiffe fiir eine Teilmenge 


Die drei untersuchten Verfahren erreichen eine höhere Genauigkeit und Tref- 
ferquote im Vergleich zur punktbasierten Anomaliedetektion. Dies spiegelt 
sich auch im F1-Maß für die einzelnen Algorithmen wider: Das GMM er- 
reicht hier 0,832, die SVM 0,827 und das MLP 0,892. Auffällig sind beim GMM 
die höhere Falsch-positiv-Rate von 0,121 und die niedrigere Genauigkeit von 
0,780. Dieser Sachverhalt ist auch in Abbildung 5.11 zu erkennen: Die Abbil- 
dung 5.11b weist deutlich mehr falsch positiv klassifizierte Trajektorien auf 
als Abbildungen 5.11c und 5.11d. Die niedrigere Trefferquote der SVM von 
0,746 lässt sich durch eine größere Menge an falsch negativen Klassifikatio- 
nen erklären: Im Vergleich mit Abbildungen 5.11b und 5.11d finden sich in 
Abbildung 5.11c deutlich mehr falsch Negative. 


Aus Abbildung 5.10 lässt sich im Mittel für das GMM eine AUC von 0,94, 
für die SVM von 0,90 und für das MLP von 0,92 ablesen, wohingegen die 


101 


5 Detektion von Positions- und kinematischen Anomalien 


AP bei 0,88, 0,92 und 0,94 liegt. Es zeigt sich also fiir die ROC-Kurve ein 
geringfügig schlechteres, aber für die PR-Kurve ein deutlich besseres Ergebnis 
im Vergleich zu der punktbasierten Anomaliedetektion. 


5.4 Schlussfolgerung 


Mit der punktbasierten Anomaliedetektion konnten bereits Positions- und ki- 
nematische Anomalien erkannt werden. Um das Verfahren zu verbessern, ware 
es für die Schätzung der Wahrscheinlichkeitsdichte mit einer GMM denkbar, 
Vorwissen zur Geographie einzubringen. Es kann bspw. bei der Initialisierung 
der Komponenten darauf geachtet werden, dass diese in Bereichen mit Ver- 
kehr initialisiert werden. Außerdem können statt einer GMM für das gesamte 
Gebiet mehrere GMMs jeweils für Teilgebiete eingelernt werden, um damit 
die Anzahl der Komponenten je Gebiet zu verringern. Bei der Verwendung 
einer KDE kann für die Beachtung unterschiedlicher Dichten im Verkehr ei- 
ne adaptive KDE genutzt werden, die die Bandbreite der Kernel nicht über 
das gesamte Gebiet auf einem Wert belässt, sondern sich an die Komplexität 
lokal anpasst. 


Da das punktbasierte Vorgehen zu unzureichenden Ergebnissen geführt hat, 
wurde im nächsten Schritt ein trajektorienbasiertes Verfahren evaluiert. Die- 
ses ermöglicht auch Anomalien zu erkennen, die nur bedingt durch den zeit- 
lichen Verlauf zur Anomalie werden. Die trajektorienbasierte Anomaliede- 
tektion zeigt insgesamt eine bessere Klassifikationsgüte als die punktbasierte 
Anomaliedetektion. Es bleiben aber auch hier noch weitere Herausforderun- 
gen. Aufgrund der Glättung der Trajektorien können kleine Anomalien nicht 
erkannt werden. Außerdem muss die gesamte Trajektorie bekannt sein, damit 
dieser Algorithmus zur Erkennung von Anomalien verwendet werden kann. 
Daher kann er nur im Nachhinein Aufschluss über Anomalien geben. Um ei- 
ne Echtzeitauswertung zu ermöglichen, könnte eine Prädiktion auf Grundlage 
historischer Fahrmuster und zusätzlicher Daten aus dem AIS zum Zielhafen 
geschätzt und diese Schätzung zur Anomaliedetektion genutzt werden. Eine 


102 


5.4 Schlussfolgerung 


weitere Möglichkeit ist die Verwendung von Tracklets anstelle der vollstän- 
digen Trajektorien. Dies sind Teiltrajektorien, die immer nur einen gewissen 
zuvor definierten Zeithorizont abbilden. 


Auch nach diesen Verbesserungen würden die Verfahren jedoch vorhandenes 
Hintergrundwissen ignorieren und damit nicht alle Anomalien korrekt erken- 
nen. Der gegebene Kontext kann von enormer Bedeutung sein, da z.B. ein 
Abweichen von einer Fahrroute für diese Verfahren direkt zu einer Anomalie 
führt, jedoch in der Realität ein einfaches Ausweichmanöver darstellen kann. 
Ein solches Verhalten sollte nur in kritischen Situationen zur Alarmierung 
der Anwender/-innen einer Entscheidungsunterstützung führen. Aus diesem 
Grund werden im nächsten Schritt Verfahren analysiert, die den Kontext ei- 
ner Situation mit einbinden. 
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6 Detektion von kontextuellen 
Anomalien - spieltheoretisches 
Verhaltensmodell 


»Spielen ist Experimentieren mit dem Zufall.« 


— Novalis 


Ergebnisse aus diesem Kapitel wurden im Rahmen der »9th International 
Conference on Agents and Artificial Intelligence« [Ann17b] und des »2016 
Joint Workshop of Fraunhofer IOSB and Institute for Anthropomatics, Vision 
and Fusion Laboratory« [Ann17a] vorgestellt sowie in der Abschlussarbeit 
[Dur16] betreuend erarbeitet. 


6.1 Problem und Zielsetzung 


In Kapitel 5 wurde dargelegt, wie verschiedene maschinelle Lernverfahren da- 
zu genutzt werden können, einfache Positions- und kinematische Anomalien in 
den Verkehrsdaten von Schiffen zu detektieren. Die Qualität dieser Anoma- 
liedetektion ist jedoch nicht ausreichend: Zum einen war die Klassifikations- 
güte der Einzelergebnisse nicht überzeugend und zum anderen kann an ein- 
fachen Beispielen gezeigt werden, dass der Kontext zur Klassifikation einer 
Anomalie eine besondere Rolle einnimmt. Hier sei bspw. die Anpassung der 
Geschwindigkeit an Sicht- und Wetterbedingungen oder das Ausweichen bei 
möglichen Kollisionen mit anderen Verkehrsteilnehmern genannt. Außerdem 
zeigen nicht alle zu beobachtenden Objekte ein identisches Verhaltensmuster, 
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z.B. unterscheidet sich das Verhalten kreuzender Segelboote stark von demje- 
nigen unter Motor fahrender Boote. Außerdem sind die Ergebnisse der Ano- 
maliedetektion nicht immer einfach zu deuten. Es ist also nicht immer klar, 
warum eine Situation als Anomalie gekennzeichnet wird. 


Um die Interaktion der Schiffe untereinander abzubilden, wird in diesem 
Kapitel ein Verhaltensmodell basierend auf spieltheoretischen Überlegungen 
entworfen. Als Grundlage wird das in Kapitel 4 erweiterte OOWM zur Um- 
weltmodellierung genutzt. Ein solches Verhaltensmodell ermöglicht durch 
die Auswertung der zugrundeliegenden Nutzenfunktion einen guten Einblick 
in die Entscheidungsfindung. 


6.2 Methodik 


Im Folgenden werden in einem kurzen Überblick die verwendeten spieltheo- 
retischen Überlegungen eingeführt und an das Problem der Verhaltensmodel- 
lierung angepasst. Spieltheoretische Konzepte sollen insbesondere rationales 
Verhalten modellieren. Sie sind häufig aus der Ökonomie motiviert und ge- 
hen davon aus, dass teilnehmende Spieler sich rational verhalten und entwe- 
der den eigenen Nutzen oder den gemeinsamen Nutzen maximieren wollen. 
Dafür steht ein großer Fundus an Lösungskonzepten zur Verfügung, die es er- 
möglichen, sowohl kooperatives als auch nichtkooperatives Verhalten abzu- 
bilden. Eine detaillierte Einführung in die Spieltheorie wird bspw. in [Hol19] 
gegeben. 


Eine Erweiterung zu dem in Gleichung (4.4) eingeführten, nichtkooperativen 
Spiel ist das Verhandlungsspiel. In diesem soll eine Verhandlungssituation ab- 
gebildet werden. Dafür wird ein sogenannter Konfliktpunkt eingeführt. Ein 
Verhandlungsspiel 


Tp = (N, P,c) (6.1) 
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wird nach Gleichung (4.5) definiert durch die Menge aller Spieler N = 
{1,...,n}, den Auszahlungsraum P C R” - also alle erreichbaren Auszah- 
lungskombinationen - und den Konfliktpunkt c € P. Der Konfliktpunkt 
stellt den Auszahlungsbetrag c; für i € N dar, den der Spieler i erhält, wenn 
keine Einigung erzielt wird. 


6.2.1 Nash-Verhandlungslösung 


Zur Charakterisierung einer fairen Lösung in einem Verhandlungsspiel wur- 
de von Nash [Nas50] ein Axiomensystem bestehend aus vier Axiomen ein- 
geführt: Pareto-Optimalität, Unabhängigkeit von irrelevanten Alternativen, 
Symmetrie und Invarianz gegenüber affinen Transformationen. Es kann ge- 
zeigt werden, dass die Lösung für das Optimierungsproblem 


n 

max [[@ — ci) (6.2) 
i=1 

st: ueP 


uU = G ViEN 


ebendiese Axiome erfüllt und damit eine faire Lösung fiir Verhandlungsspiele 
nach Gleichung (6.1) darstellt. Die Zielfunktion in Gleichung (6.2) wird auch 
als Nash-Produkt bezeichnet. In der Literatur wurden auch andere Axiomen- 
systeme eingeführt. Ein Beispiel wäre die Kalai-Smorodinsky-Verhandlungs- 
lösung, die aber im Gegensatz zur Nash-Verhandlungslösung nicht für n > 2 
Spieler gültig ist. 


Zur Lösung des Optimierungsproblems wird der von Storn und Price [Sto97] 
eingeführte Differential-Evolution-Algorithmus eingesetzt. Die hierbei gefun- 
dene Lösung ist nicht zwangsläufig optimal, es werden für die Optimierung 
aber keine Informationen zum Gradienten benötigt. 
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6.2.2 Spieltheoretisches Modell des Schiffsverhaltens 


Das Verhalten der Spieler in einem spieltheoretischen Modell hangt haupt- 
sächlich von der gewählten Nutzenfunktion u und dem Lösungskonzept ab. 
Hier wird die Nash-Verhandlungslösung verwendet, um die optimale Strategie 
für die Spieler zu ermitteln. 


Der Zustand eines Spielers i € N zum Zeitpunkt t ist gegeben durch seine 
Position Pii = (Pi ilon Pt,i, Jat), seine Geschwindigkeit v; ; und seinen Kurs 
über Grund ¢, ;. Wie in der (nautischen) Navigation üblich wird hier der Kurs 
gegenüber rechtweisend Nord im mathematisch negativen Drehsinn gezählt. 


Außerdem folgt jeder Spieler einer Route, die aus mehreren Wegpunkten be- 
steht, und jeder Spieler möchte einen Zielpunkt p; q erreichen. Kein Spieler 
wünscht eine Kollision, jeder Spieler möchte seiner Route folgen und sein 
Ziel so schnell wie möglich erreichen. 


Die Position jedes Spielers ist in geographischen Koordinaten beschrieben. 
Daher wird, wenn nicht anders angegeben, die Großkreisentfernung d,.(a, b) 
fiir die Entfernungsberechnungen zwischen zwei Punkten a und b verwendet. 


6.2.2.1 Strategien 


Die möglichen Strategien eines Spielers basieren auf den nächsten erreich- 
baren Positionen. Dafür wird hier das folgende einfache Bewegungsmodell 
verwendet: Jedes Schiff kann zu jedem Zeitschritt seine Geschwindigkeit und 
seinen Kurs ändern. Für den nächsten Zeitschritt t + 1 ergeben sich die Ge- 
schwindigkeit (begrenzt für jedes Schiff i auf Vi max) und der Kurs für ein Schiff 
i zu 


Ut+1,i = Au; - U; max > mit Au; € [-1, 1] und (6.3) 
Pr4ii = Pri + Adi, mit Ad; E [—45°, 45°]. (6.4) 


Die neue Position P41, wird dann unter Verwendung des Großkreises mit 
dem neuen Kurs über Grund $,; ,; und der Geschwindigkeit v;,1; geschätzt. 
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Jeder Spieler i folgt also einer Strategie bestehend aus 


BY = (Adj, Av). 
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(6.5) 
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(d) Überlagerung von u1,q, U1,- und U] ,p 


Abbildung 6.1: Die Nutzenfunktionen für einen Spieler, der sich auf der Position (50, 50) be- 
findet und sich auf der Route (0,50) — (150, 50) bewegt. Dabei gibt es auf der 
Position (100,50) einen weiteren stationären Spieler. Für die Simulation gilt 
ôr = 20 und dp = 25. Der Farbverlauf stellt den Nutzen des Spielers 1 dar. Die 
Abstände wurden mit der euklidischen Norm bestimmt. 


6.2.2.2 Nutzenfunktion 


Die Nutzenfunktion ist durch vier Komponenten gegeben, die ein wünschens- 


wertes Verhalten eines Spielers definieren. Der Gesamtnutzen ist dann durch 


die Überlagerung der anwendbaren Komponenten gegeben. Verschiedene 
Komponenten und deren Überlagerung werden in Abbildung 6.1 gezeigt. Der 


109 


6 Detektion von kontextuellen Anomalien - spieltheoretisches Verhaltensmodell 


Nutzen für das Erreichen des Zielortes ergibt sich aus dem Verhältnis zwi- 
schen der Entfernung zum Zielort zum Zeitpunkt t + 1 und der Entfernung 
zum Zielort zum Zeitpunkt t 


d,.(Pt+1,i,Pi,d) 

Uid = dyer Pid) | (6.6) 
Die Nutzenfunktion ist in Abbildung 6.1a fiir ein Beispielszenario zu sehen. 
Um den Abstand zur Route zu bewerten, wird der Abstand d, ; zwischen der 
Route und der Position des Spielers zum nächsten Zeitpunkt p, ; |; bestimmt. 
Durch den Parameter 6, wird ein Bereich um die Route definiert, der immer 
den vollen Nutzen bringt. Erst bei größeren Abweichungen wird die neue Po- 
sition weniger Nutzen einbringen. Die resultierende Nutzenfunktion 


1, falls d,i < ô 
Uir = (6.7) 


——-d,; +2, sonst 
6 


ist in Abbildung 6.1b dargestellt. Der Nutzen fiir einen Spieler i fiir das Ab- 
standhalten zu anderen Spielern kann durch 


d z ;, ; 
= min (min re Pirri Put .)) (6.8) 


U; 
bP jen\{i} Ôp 


beschrieben werden. Der Parameter 6 p dient dazu, den Abstand einzustellen, 
den ein Spieler zu den anderen Spielern einhalten möchte. Die Nutzenfunkti- 
on ist in Abbildung 6.1c dargestellt. Die Überlagerung der Komponenten ti q, 
Ui r und U; p ist für eine Beispielkonstellation in Abbildung 6.1d dargestellt. 


Da kein Spieler im normalen Schiffsverkehr eine Kollision mit einem ande- 
ren Spieler wünscht, muss ein Mechanismus implementiert werden, der die- 
ses Problem abdeckt. Dazu wird eine Nutzenfunktion eingeführt, die die Ver- 
meidung von Kollisionen realistisch abbildet. Da das Verhalten motorisierter 
Schiffe analysiert wird, müssen die Schiffe nach den Kollisionsverhütungsre- 
geln in der Verordnung zur Seestraßenordnung — Anlage zu § 1 Teil B Ausweich- 


110 


6.3 Ergebnis 


und Fahrregeln eine Kollision vermeiden, indem sie nach Steuerbord (zur rech- 
ten Seite) abdrehen. Die Nutzenfunktion 


2A¢; 

Uic = max (o. -| $ — 1)) (6.9) 
i 45 

wird als Komponente dazugeschaltet, wenn eine mögliche Kollision vorher- 

gesagt wird, um ebendieses Verhalten zu erzeugen. 


6.3 Ergebnis 


Zur Evaluierung des spieltheoretischen Verhaltensmodells werden Trajekto- 
rien aus dem IOSB-Western-Baltic-Sea-Datensatz (siehe Abschnitt 3.2.1) be- 
nutzt. Insbesondere der Fährverkehr zwischen Fehmarn und Lolland ist hier 
von Interesse, da ein Abweichen von der Route zum Teil ein gewünschtes 
Ausweichmanöver darstellt. Daher stammen die genutzten Trajektorien aus 
dem Fehmarn-Gebiet (siehe Abbildungen 3.4 und 3.5c). Zunächst soll gezeigt 
werden, wie das Modell zur Prädiktion der Position der beteiligten Schiffe ge- 
nutzt werden kann, um daran anschließend darzulegen, wie das Modell zur 
Anomaliedetektion verwendet werden kann. 


6.3.1 Prädiktion der Position 


Zur Veranschaulichung des Algorithmus werden zwei Konstellationen be- 
trachtet: zum einen zwei Schiffe, die auf der gleichen Route fahren, während 
das eine das andere überholt (im Folgenden »Überholmanöver«), zum ande- 
ren drei Schiffe, die sich zwischen Fehmarn und Lolland auf ihren Routen 
begegnen (im Folgenden »kreuzender Verkehr«). 
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+ aufgezeichnete Daten 
54.6°N 4 —E- aufgezeichnete Daten 
-@- 6)=15 
-@- 6)=2.0 

6) =2.5 


54.55°N 


54.5°N 4 


54.45°N -| 


11.4°E 11,5°E 11.6°E 11.7°E 


Abbildung 6.2: Prädiktion der Position für die Konstellation »Überholmanöver« mit verschie- 
denen Werten für 6p 


Da sich die Schiffe in der Konstellation »Überholmanöver« mit unterschiedli- 
chen Geschwindigkeiten auf der gleichen Route bewegen, kommt es zu einem 
Überholmanöver. Die Ergebnisse der Prädiktion neben den aufgezeichneten 
Daten sind für verschiedene Werte für ö, in Abbildung 6.2 zu sehen. Ein nied- 
riger Wert für 6 p bedeutet, dass die Schiffe näher aneinander heranfahren. Der 
Parameter gibt also an, wie risikofreudig das jeweilige Schiff fährt. 


In Abbildung 6.3 ist die Nutzenfunktion für einen Zeitpunkt für den blauen 
Spieler dargestellt. Das blaue Quadrat in dieser Abbildung ist die aktuelle Po- 
sition des blauen Schiffes, während das grüne Quadrat die nächste Position 
des grünen Schiffes darstellt. Der Einfluss von u, und ug ist deutlich zu er- 
kennen, zum einen als heller Korridor, auf dem sich beide Schiffe bewegen, 
zum anderen durch den Farbverlauf innerhalb des Korridors (südöstlich star- 
tend mit einem dunkleren Farbton und nach Nordwesten heller werdend). Bei 
der nächsten Position des grünen Schiffes ist der Einfluss von u, als ein Kreis 


112 


6.3 Ergebnis 


um die aktuelle Position herum zu erkennen. Insgesamt lasst sich das Verhal- 
ten in dieser einfachen Situation durch die Anpassung der Parameter mit dem 
vorgeschlagenen Ansatz gut reproduzieren. 


0.73 


—#- aufgezeichnet 
—-— aufgezeichnet 


54.55°N 4 


54.45°N 4 


11.4°E 11.45°E 11.5°E 11.55°E 11.6°E 11.65°E 11.7°E 


Abbildung 6.3: Die Nutzenfunktion mit Ôp = 1.5 für einen Spieler in der Konstellation »Über- 
holmanöver«. Die Hintergrundfarbe zeigt den Nutzen des blauen Schiffs an der 
gezeigten Position an. Je höher der erreichte Nutzen, desto heller ist die Farbe. 


In der Konstellation »Überholmanöver« fahren die Schiffe nicht auf einem 
direkten Kollisionskurs, da beide Schiffe mit genügend Abstand zueinander 
fahren können. Daher wurde die zweite Konstellation »kreuzender Verkehr« 
so ausgewählt, dass die beteiligten Schiffe ohne Ausweichmanöver kollidieren 
würden. Die Ergebnisse der Prädiktion sind für unterschiedliche Werte des 
Parameters 6, in Abbildung 6.4 zu sehen. Das grüne Schiff fährt auf dem Kiel- 
-Ostsee-Weg von Osten nach Westen, während die beiden Fähren von Nord 
nach Süd (blau) bzw. von Süd nach Nord (orange) fahren. 
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Abbildung 6.4: Prädiktion für die Konstellation »kreuzender Verkehr« mit verschiedenen Wer- 
ten für bp 
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Der Einfluss des Parameters 6 p ist gut sichtbar. Für 6 p= 2.5, wie in Abbil- 
dung 6.4b dargestellt, ahnelt die Simulation stark dem realen Pfad der Schiffe. 
Für die anderen Werte weicht die Prädiktion zum Teil deutlich von dem auf- 
gezeichneten Verhalten ab. In Abbildung 6.4a wird keine mögliche Kollision 
erkannt, da die blaue und orange Fähre näher beieinander fahren können. Da- 
durch fahren die Schiffe auf einer geraden Linie ohne Ausweichmanöver. In 
Abbildung 6.4c wird eine bevorstehende Kollision zwischen dem grünen und 
dem blauen Schiff erkannt. Der Abstand, den die Schiffe zueinander wahren 
wollen, ist jedoch zu groß gewählt, sodass das blaue und das grüne Schiff von 
der aufgezeichneten Route stark abweichen müssen. 


6.3.2 Anomaliedetektion basierend auf dem prädizierten 
Verhalten 


In diesem Abschnitt wird nur die komplexere Konstellation »kreuzender Ver- 
kehr« betrachtet. Um einen Anomaliewert für das Verhalten der Schiffe ab- 
zuschätzen, wird für jeden Zeitschritt ein neues Spiel gestartet, d.h., es wird 
immer nur ein Zeitschritt prädiziert. Um einen besseren Einblick in den Ent- 
scheidungsprozess zu geben, sind die Nutzenfunktionen für die verschiedenen 
Spieler zu einem Zeitpunkt in Abbildung 6.5 dargestellt. Das grüne und das 
blaue Schiff (siehe Abbildungen 6.5a und 6.5c) erkennen jeweils die mögli- 
che Kollision zu diesem Zeitpunkt. Daher wird die Nutzenfunktion zusätzlich 
mit der Nutzenfunktion zur Kollisionsvermeidung überlagert. Dadurch erge- 
ben die neuen Positionen auf Steuerbordseite einen höheren Nutzen für das 
jeweilige Schiff. In allen Fällen ist der Nutzen, der durch das Festhalten an 
der Route gewonnen wird, deutlich sichtbar. Darüber hinaus sind die höhere 
Auszahlung für die Verringerung der Entfernung zum Ziel sowie die geringere 
Auszahlung in der Nähe von anderen Spielern klar zu erkennen. 
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Abbildung 6.5: Nutzenfunktionen in der Konstellation »kreuzender Verkehr« 
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Im Vergleich zur bisherigen vollstandigen Pradiktion des Pfades wird nun fiir 


jeden Zeitschritt eine einzelne Prädiktion durchgeführt. Die Ergebnisse sind 


in Abbildung 6.6 dargestellt. Der Nutzen für das grüne Schiff unter der Vor- 
aussetzung der ausführbaren Strategien ist zusätzlich als Heatmap in Form 


eines Kreissektors eingezeichnet. Wegen der möglichen Kollision zwischen 
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dem blauen und dem grünen Schiff ergibt die Steuerbordseite in diesem Zeit- 
schritt höhere Auszahlungen. 
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Abbildung 6.6: Prädiktion der einzelnen Zeitschritte in der Konstellation »kreuzender Verkehr« 
für Op = 2.5. Der mit einem Farbverlauf gefüllte Kreissektor gibt den möglichen 
Nutzen für das grüne Schiff im nächsten Zeitschritt für die jeweilige neue Posi- 
tion an. 


Ein Anomaliewert soll bestimmen, ob das reale Verhalten auffällig von dem 
prädizierten Verhalten abweicht. Dieser kann auf unterschiedliche Weisen ge- 
neriert werden, um jeweils bestimmte Informationen wie Distanzwerte ein- 
fließen zu lassen. Eine Möglichkeit besteht darin, den Abstand zwischen der 
prädizierten Position und der realen Position zu bestimmen, eine weitere dar- 
in, den Nutzen für beide Positionen auszuwerten. 
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In Abbildung 6.7 sind die Anomaliewerte fiir beide Methoden zu jedem Zeit- 
schritt dargestellt. In Abbildung 6.7a ist der Anomaliewert auf Basis der Di- 
stanz gezeigt, in Abbildung 6.7b basierend auf dem Verhältnis zwischen rea- 
lem u; rea] und prädiziertem Nutzen Ui sim des Spielers i nach 
Ui real 


Anomaliewert; = 1 — (6.10) 


Ui sim 


Die Ergebnisse in Abbildung 6.7a lassen nicht auf einen eindeutigen Grenz- 
wert für eine anomale Distanz schließen. Der Abstand zwischen der prädi- 
zierten und der realen Position ist immer größer als 100 m. Vergleicht man 
die beiden Methoden, so wird deutlich, dass die Abweichung in der Position 
nicht damit einhergeht, dass die Prädiktion oder die realen Daten tatsächlich 
einen viel größeren Nutzen für den jeweiligen Spieler bedeuteten: Mit Aus- 
nahme des zweiten Zeitschrittes ist in Abbildung 6.7b das Nutzenverhältnis 
immer kleiner als 0,1. Hierbei ist zu beachten, dass der höhere Wert im letzten 
Zeitschritt für das orange Schiff durch die nicht näher modellierte Einfahrt in 
den Hafen erklärt werden kann. Mit der passenden Modellierung sollte der 
Anomaliewert für diesen Zeitschritt auch geringer ausfallen. 


Darüber hinaus ist der für die reale Position ermittelte Nutzen aufgrund der 
geschätzten maximalen Geschwindigkeit manchmal größer als der simulierte. 
Da die Nash-Verhandlungslösung eine faire Auszahlungsverteilung für alle 
Spieler bestimmt, könnte eine Strategie für einen einzelnen Spieler existieren, 
die eine höhere Auszahlung für diesen Spieler ergibt. 


Insgesamt ist das Nutzenverhältnis die bessere Anomaliebewertung. So wird 
z. B. ein hoher Anomaliewert für das grüne und das blaue Schiff im zweiten 
Zeitschritt in Abbildung 6.7b geschätzt. In Abbildung 6.6 halten das grüne 
und das blaue Schiff im zweiten Zeitschritt nicht so viel Abstand zueinander 
wie in den anderen Zeitschritten. Daher kann dieses Verhalten tatsächlich als 
Anomalie angesehen werden. Auch im dritten Zeitschritt weicht das grüne 
Schiff von der Prädiktion ab, aber der Nutzen bleibt ähnlich. 
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Abbildung 6.7: Anomaliewerte für die Konstellation »kreuzender Verkehr« 


6.4 Schlussfolgerung 


Es konnte erfolgreich gezeigt werden, dass mit dem vorgestellten spieltheo- 
retischen Modell das Verhalten von Schiffen prädiziert werden kann. Dafür 
wurden aufgezeichnete Trajektorien mit Prädiktionen verglichen. In den Da- 
ten werden bis zu drei Schiffe betrachtet, die miteinander interagieren. Basie- 
rend auf diesen Ergebnissen wurden zwei Möglichkeiten zur Anomaliedetek- 
tion aufgezeigt. Hierbei hat sich erwiesen, dass nur das Verfahren auf Basis 
des Nutzenverhältnisses zwischen Prädiktion und realen Daten ein sinnvolles 
Ergebnis liefert. 


Für die Evaluation wurden zwei reale Situationen aufgegriffen. Diese wurden 
zwar durch das spieltheoretische Modell gut nachgebildet. Um die generel- 
le Leistungsfähigkeit des Ansatzes zu zeigen, sollten in zukünftigen Arbeiten 
aber weitere Situationen betrachtet werden. Optimierungspotenzial besteht 
auch im Bewegungsmodell. Das hier verwendete Modell bildet nur rudimen- 
tär realen Schiffsverkehr ab. Durch ein besseres Modell, das bspw. die Trägheit 
des Schiffs korrekt mit einbezieht, stünden dem spieltheoretischen Modell nur 
noch realistische Strategien zur Verfügung. 
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Die Nutzenfunktionen und die dazugehörigen Parameter wurden in diesem 
Kapitel händisch bestimmt. Da durch das AIS große Mengen an Verkehrsdaten 
zur Verfügung stehen, böte sich hier die Untersuchung von Verfahren an, um 
diese Nutzenfunktionen aus den Daten zu erlernen. 
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7 Detektion von kontextuellen 
Anomalien — 
Schiffstypklassifikation 


»Ein Schiff im Hafen ist sicher, doch dafür werden Schiffe nicht 
gebaut.« 


— John Augustus Shedd 


Ergebnisse aus diesem Kapitel wurden im Rahmen des »Upper-Rhine Arti- 
ficial Intelligence Symposium 2020« [Ann20b] vorgestellt sowie in den Ab- 
schlussarbeiten [Str19, Har20] betreuend erarbeitet. 


7.1 Problem und Zielsetzung 


Anhand von Schiffstypen ist es möglich, bestimmte Verhaltensmuster abzu- 
leiten und aufgrund von Abweichungen auf Anomalien zu schließen. Da eine 
Selbstauskunft basierend auf AIS fehleranfällig ist und unter Umständen auch 
im Rahmen von illegalen Aktivitäten ausgenutzt werden kann, ist diese gera- 
de in kritischen Situationen keine zuverlässige Quelle. Daher ist das Ziel in 
diesem Kapitel, ein Verfahren auf Basis eines künstlichen neuronalen Netzes 
zu entwickeln, mit dem es möglich ist, den Typ eines Schiffes anhand der je- 
weils gefahrenen Trajektorie zu klassifizieren. 
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7.2 Methodik 


Zunächst werden hier die Schritte erläutert, mit denen aus den rohen AIS-Da- 
ten ein Datensatz extrahiert werden kann, der zum Einlernen der neuronalen 
Netze benutzt werden kann. Im Anschluss werden die verwendeten Archi- 
tekturen vorgestellt. 


7.2.1 Extraktion der Trainingsdaten 


Zur Extraktion der Trainingsdaten dient der in Abbildung 7.1 dargestellte Ab- 
lauf. Die wichtigsten Schritte sind hier, fehlerhafte Daten zu entfernen, die 
Gesamttrajektorien zu segmentieren und zu filtern, sowie weitere Merkmale 
aus zusätzlichen Informationsquellen abzuleiten. 


Als Grundlage dient der in Abschnitt 3.2.2 beschriebene JOSB-AISHub-Daten- 
satz. Zusätzlich werden Geoinformationen wie die weltweit größten Flüsse 
und Häfen sowie die Küstenlinien verwendet. Im ersten Schritt wird eine Lis- 
te der eindeutigen im Datensatz enthaltenen MMSIs generiert. Für jede MMSI 
werden die Positionsdaten zu Trajektorien verbunden und zur weiteren Verar- 
beitung verwendet. Die Segmentierung in separate Trajektorien ist der nächs- 
te Schritt (in Abbildung 7.1 gelb). Die resultierenden Trajektorien werden ge- 
filtert (in Abbildung 7.1 orange). Basierend auf den verbleibenden Trajekto- 
rien werden geographische (in Abbildung 7.1 grün) und trajektorienbasierte 
Merkmale (in Abbildung 7.1 violett) abgeleitet. Die so generierten Sequen- 
zen werden im Anschluss normalisiert (in Abbildung 7.1 rot), woraus sich 
der endgültige Datensatz ergibt. Im weiteren Verlauf werden nur Modelle für 
die sechs Hauptschiffstypen im Datensatz generiert. Dabei handelt es sich um 
»Cargo«, »Tanker«, »Fishing«, »Passenger«, »Pleasure Craft« und »Tug«. Da 
»Tanker« und »Cargo« ein ähnliches Verhalten aufweisen, werden diese zu 
einer gemeinsamen Klasse »Cargo-Tanker« zusammengefasst. 
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AIS-Daten sortiert nach MMSI 


Für jede MMSI 
Segmentierung 


Liste segmentierter Trajektorien 


Für jede Trajektorie 


Filterung 


Geographische TT Trajektorienmerkmale 


Liste extrahierter Sequenzen 


Für jede Sequenz 


Normalisierung 


A Extrahierter Datensatz 


Abbildung 7.1: Schematischer Ablauf der Vorverarbeitung 


7.2.1.1 Segmentierung 


Die Trajektorien werden aufgrund ihrer Länge oder aufgrund von Lücken (al- 
so fehlenden Daten im Verlauf der Trajektorie) segmentiert. Lücken können 
bei vom AIS aufgezeichneten Trajektorien bspw. durch unzureichende Abde- 
ckung oder generelle Übertragungsfehler entstehen. Außerdem sind Schiffe, 
die sich nicht entsprechend den Richtlinien verhalten und ihre MMSI nicht 
korrekt eingestellt haben, ein Problem. So können im Datensatz bspw. mehre- 
re Schiffe ausgemacht werden, die die jeweilige Standardeinstellung der MMSI 
des jeweiligen Geräteherstellers nicht verändert haben. Typische Kennungen 
sind dafür etwa »123456789« oder neun identische Zahlen. 
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Um diese Fehler herauszufiltern und korrekt zu behandeln, werden Trajekto- 
rien nach zwei Kriterien in Segmente aufgeteilt: zum einen wenn der zeitliche 
Abstand zwischen zwei Datenpunkten größer als zwei Stunden ist und zum 
anderen wenn der räumliche Abstand zwischen zwei Datenpunkten groß ist. 
Für den räumlichen Abstand wird hier die euklidische Distanz unter Verwen- 
dung des Längen- bzw. Breitengrades als Approximation benutzt. Der Grenz- 
wert liegt bei 0,0001°. Dies entspricht am Äquator etwa 1km und auf dem 
60. Breitengrad etwa 0,6 km. 


Da die verwendeten Netzarchitekturen eine feste Eingangsgröße erwarten, 
werden die Trajektorien anhand folgender Regeln geteilt: 


« Längere Sequenzen werden entsprechend der gewünschten 
Sequenzlänge in Stücke geteilt. 


e Jede verbleibende Restsequenz, die kürzer als 80 % der gewünschten 
Länge ist, wird verworfen. 


e Alle anderen Sequenzen werden mit Nullen aufgefüllt, um die 
gewünschte Länge zu erreichen. 


7.2.1.2 Filterung 


Nach der Segmentierung werden die Daten weiter gefiltert. Da das Verhalten 
auf hoher See klassifiziert werden soll, werden stationäre Schiffe, die z.B. vor 
Anker liegen, sowie Schiffe auf Flüssen entfernt. Das Maß stationary für eine 
stationäre Position ist dafür hier wie folgt definiert: 


n-1 
%;-ı [Pir — Pil 
So 


(7.1) 


stationary = 


Hierbei beschreibt n die Länge der Sequenz und p; die Position eines Daten- 
punktes i. Wenn der Wert stationary unterhalb eines Schwellwerts liegt, gilt die 
dazugehörige Sequenz als stationär und wird aus dem Datensatz entfernt. 
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Eine Karte mit den größten Flüssen der Welt’ wird benutzt, um Sequenzen, 
die sich nicht zu mindestens 50 % auf hoher See befinden, aus dem Datensatz 
zu entfernen. 


7.2.1.3 Trajektorienmerkmale 


Insgesamt werden drei Merkmale direkt aus den Trajektoriendaten extrahiert: 
e Zeitdifferenz 
e Geschwindigkeit über Grund 


e Kurs über Grund 


60.2°N 4 
59.6°N 4 
@ nur »high« É 
; A \ = 
59°N | m nur »intermediate« Pe 5 ee 
»high« und »intermediate« 7 \ 2^ 
- orin AÝ _ 
4.5°E 5.6°E 6.7°E 


Abbildung 7.2: Vergleich zwischen zwei Auflösungsstufen der verwendeten Kiistenliniendaten- 
bank 


Die AIS-Daten werden in regelmäßigen Intervallen von den Schiffen basie- 
rend auf ihrer Geschwindigkeit und ihrem Navigationsstatus ausgesendet 


* http://www.soest.hawaii.edu/wessel/gshhg/, letzter Abruf am 04.03.2020. 
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(vgl. Tabelle 2.2). Da aber zum einen nicht alle Datenpakete empfangen 
werden können und zum anderen durch Geschwindigkeitsänderungen die 
Sendeintervalle variieren können, kann nicht davon ausgegangen werden, 
dass alle Datenpunkte zeitlich äquidistant vorliegen. Die zeitliche Kompo- 
nente muss also explizit als Merkmal betrachtet werden. Dazu wird hier 
jeweils die Zeitdifferenz zwischen zwei aufeinander folgenden Datenpunkten 
bestimmt und als Merkmal eingeführt. 


Die Geschwindigkeit und der Kurs können direkt aus den AIS-Daten extra- 
hiert werden. Diese werden ohne weitere Verarbeitung unmittelbar als Merk- 
mal verwendet. Die Geschwindigkeit hat hier eine Auflösung von 0,1 kn und 
liegt in dem Intervall [0, 102,2]. Der Kurs wird gegenüber rechtweisend Nord 
im mathematisch negativen Drehsinn im Intervall [0, 359] angegeben. 


Zusätzlich werden zwei verschiedene Transformationen der Trajektorie 
durchgeführt: zum einen »relative-to-first«, zum anderen »relative-to-zero«. 
Im ersten Fall wird der Startpunkt jeder Sequenz in den Ursprung verscho- 
ben. Im zweiten Fall wird zusätzlich die Sequenz rotiert, sodass der Endpunkt 
auf der Abszisse liegt. Diese Transformationen sollen den Lernprozess der 
Verhaltensmuster beschleunigen. 


7.2.1.4 Geographische Merkmale 


Als zusätzliche Merkmale werden zwei geographische Merkmale auf Basis 
von weiteren Informationen bestimmt: zum einen der Abstand zur Küste, zum 
anderen der Abstand zu Häfen. Für Ersteres kommt eine Karte der Küstenli- 
nien’ zum Einsatz. Diese besteht aus einzelnen Polygonzügen und steht in 
unterschiedlichen Auflösungen zur Verfügung. Ein Vergleich von zwei Auf- 
lösungen ist für einen Ausschnitt der norwegischen Atlantikküste in Abbil- 
dung 7.2 wiedergegeben. Die Küstenlinie eignet sich gut zum Vergleich, da 
durch die Fjorde eine komplexe Küstenlinie entsteht. Bei den Küstenverläufen 
liegt der größte Unterschied zwischen den beiden gezeigten Auflösungen im 
Auslassen von Inseln und in der Vereinfachung von detaillierten Geometrien. 


° http://www.soest.hawaii.edu/wessel/gshhg/, letzter Abruf am 04.03.2020. 
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Da diese Unterschiede jedoch gering ausfallen, wird, um die Komplexitat der 
Berechnungen zu reduzieren, die Distanz zur Küste mit der niedrigeren Auf- 
lösung bestimmt. 


Eine Liste der 140 bedeutendsten Häfen nach dem »World Port Index«* wird 
verwendet, um den Abstand zum nächsten großen Hafen zu bestimmen. Da 
bspw. Fischerboote für eine Tagestour den eigenen Heimathafen nur bis zu 
einer bestimmten Entfernung verlassen, sollte dieses Merkmal die Klassifika- 
tion ebensolcher Verhaltensmuster erleichtern. 


7.2.1.5 Normalisierung 


Die einzelnen extrahierten Merkmale werden jeweils auf das Intervall [0,1] 
normalisiert. Für die Position wird dabei zwischen einer »lokalen« und ei- 
ner »globalen« Position unterschieden: Die »globale« Position wird zwischen 
dem Minimum und dem Maximum innerhalb des gesamten Datensatzes ska- 
liert, während für die »lokale« Position nur über die Trajektorie selbst norma- 
lisiert wird. Die Idee hierbei ist, dass das Verhalten auf zwei unterschiedlichen 
Skalen beobachtet und klassifiziert werden kann. 


Für die geographischen Merkmale werden Indizes erstellt, die die maximale 
abfragbare Entfernung einschränken. Dieser Wert wird als Maximum für die 
Skalierung verwendet. Für die Zeitdifferenz wird der Schwellwert für die Tei- 
lung der Trajektorien als Maximum verwendet, für die Geschwindigkeit und 
den Kurs die durch das AIS gegebenen Maximalwerte. Der untere Wert für 
die Skalierung ist jeweils 0. 


7.2.1.6 Resultierender Datensatz 


Die ursprünglich im IOSB-AISHub-Datensatz enthaltenen Daten werden wie 
beschrieben verarbeitet. Dabei werden sechs Datensätze extrahiert. Für alle 


* https://msi.nga.mil/Publications/WPI, letzter Abruf am 04.03.2020. 
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Datensätze werden identische Schwellwerte für die Aufteilung der Trajekto- 
rien nach Zeit und Position sowie für die Filterung verwendet. Die Daten- 
sätze unterscheiden sich zum einen bezüglich der Sequenzlänge (360, 1080 
oder 1800 Datenpunkte pro Sequenz) und zum anderen bezüglich der ange- 
wendeten Transformationen (»relative-to-first« oder »relative-to-zero«). Die 
gewählten Sequenzlängen entsprechen 1h, 3h oder 5h. Die Verteilung der 
Schiffsklassen auf die resultierenden Sequenzen in den verschiedenen Daten- 
sätzen kann Tabelle 7.1 entnommen werden. 


Tabelle 7.1: Anzahl der Sequenzen je Schiffsklasse für die verschiedenen Datensätze 


»relative-to-first« »relative-to-zero« 


Cargo-Tanker 1026 854 1155 782 

= Fishing 267 233 354 939 
= Passenger 303 690 350117 
* Pleasure Craft 156083 236 557 
Tug 414 904 482 376 
Cargo-Tanker 232213 273 340 

o Fishing 49 399 79 742 
S Passenger 68212 83781 
* Pleasure Craft 26173 51009 
Tug 110513 131145 
Cargo-Tanker 111269 126015 

o Fishing 27414 39 362 
B Passenger 35620 41757 
* Pleasure Craft 14445 24171 
Tug 61236 69 636 


7.2.2 Architektur der neuronalen Netze 


Zur Klassifikation werden hier Residual Neural Networks (ResNets), also eine 
spezielle Architektur eines CNNs, verwendet. Diese Architektur wurde ur- 
sprünglich für die Klassifikation von Bilddaten entwickelt, aber bereits Fawaz 
et al. [Faw19] konnten zeigen, dass sich ein ResNet gut zur Zeitreihenklassi- 
fikation eignet. 
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Tabelle 7.2: Parameter der neuronalen Netzwerkarchitekturen. Fiir das MLP wird eine Sequenz 
von 360 angenommen. 


Architektur Tiefe # Parameter 

Tiny ResNet 11 29125 
Shallow ResNet 21 440 837 

Deep ResNet 66 1327877 

Stretched Deep ResNet 66 3 280 645 
Split ResNet 26 390 701 
Total Split ResNet 26 364 461 
MLP 4 211909 
Tieferes MLP 6 220 229 


Der Hauptunterschied zwischen dem ResNet und anderen Architekturen ist 
das Einfiigen von sogenannten »Skip-Connections«. Diese erlauben durch zu- 
sätzliche Verbindungen das Uberspringen von Ebenen im Netz. Damit kann 
das »Vanishing-Gradient-Problem«, also die Herausforderung, dass bei tiefen 
Netzen der Gradient für die verwendeten Lernverfahren ab einer gewissen 
Tiefe unterhalb der Berechnungsauflösung liegt, umgangen werden und dies 
ermöglicht tiefere Netze. 


Aufbauend auf dieser Ursprungsidee werden verschiedene Architekturen (sie- 
he in Anhang A die Abbildungen A.1 bis A.6) abgeleitet. Weitere Details zu 
den Architekturen können der Tabelle 7.2 entnommen werden. Die Architek- 
turen bestehen jeweils aus den folgenden Blöcken: 


Convolutional Layer (Conv): Eine Faltungsschicht mit der jeweils genannten 
Kernelgröße und Schrittweite (engl. »stride«). 


Rectified Linear Unit (ReLU): Eine Aktivierungsfunktion, die nur als Positiv- 
teil ihres Arguments definiert ist. 


Max Pooling: Innerhalb der angegebenen Schrittweite (engl. »stride«) wird 
jeweils die höchste Aktivierung aus der vorherigen Schicht übernom- 


men. 
Add: Summiert die Aktivierung der eingehenden Schichten. 


Global Avg. Pooling: Bildet den Mittelwert über die zeitliche Dimension. 
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Dense Layer: Zuweisung der Ausgabeklassen. 


Der Hauptgedanke hinter den Architekturen in den Abbildungen A.1 bis A.4 
ist die Analyse der Auswirkungen der Tiefe der Netzwerke. Da die Merkmale 
selbst nicht notwendigerweise logisch miteinander verknüpft sind, wird mit 
den Architekturen in Abbildungen A.5 und A.6 untersucht, ob das Verhal- 
ten besser erfasst werden kann, indem der Netzwerkpfad für jedes Merkmal 
aufgeteilt wird. Außerdem wird untersucht, ob eine klassische MLP-Architek- 
tur bereits gute Ergebnisse erreicht. Dazu werden zwei MLPs erprobt: eines 
mit zwei versteckten Schichten und eines mit vier versteckten Schichten. Die- 
se haben jeweils 64 Neuronen und sind vollständig mit den Neuronen ihrer 
benachbarten Schichten verbunden. Bei dieser Architektur befindet sich der 
Großteil der Parameter in der ersten Schicht. Sie sind notwendig, um die gro- 
ße Anzahl von Eingangsneuronen - bei einer Sequenzlänge von 360 ergeben 
sich 360 - 9 = 3240 Eingangsneuronen - auf die erste versteckte Schicht 
abzubilden. 


7.3 Ergebnis 


Für die Evaluation werden die verschiedenen Netzarchitekturen mit Hilfe des 
Frameworks Keras [Cho15] unter Verwendung von TensorFlow [Aba16] im- 
plementiert. Die Datensätze werden jeweils wie folgt aufgeteilt: Für das Trai- 
ning werden 64 %, für die Validierung 16 % und für das Testen 20 % der Daten 
verwendet. Als Metrik wird das F1-Maß (vgl. Abschnitt 5.2.3) benutzt. 


Um den Lernprozess zu verbessern, werden die folgenden drei Regularisie- 
rungsmechanismen verwendet: ein additives Eingangsrauschen, Batch-Nor- 
malization (BN) und Early Stopping. Das Eingangsrauschen wird im Training 
hinzugefügt, um die Generalisierung der Klassifikationsergebnisse zu unter- 
stützen. Hierbei wird für jedes Merkmal eine mittelwertlose Normalverteilung 
mit der Varianz 0,0001 angenommen. Die Batch-Normalization wird vor den 
jeweiligen ReLU-Layern eingefügt und erlaubt höhere Lernraten. 


130 


7.3 Ergebnis 


1.000 
0.920 4 


0.800 4 


0.600 4 


Regularisierungsmethoden 
| Elm Keine BN., Kein Rauschen 
mmm BN., Kein Rauschen 
0.200 + mum Keine BN., Rauschen 
wem BN., Rauschen 


0.000 ME EEE EEE a 
Tiny Shallow Deep Stretched Split Total 
ResNet ResNet ResNet Deep ResNet ResNet Split ResNet 


F1 Maß 


0.400 4 


(a) »rtf« mit Sequenzlänge 360 


1.000 
0.913 4 


0.8001 | — — 
0.600 - 


Regularisierungsmethoden 
EEE Keine BN., Kein Rauschen 
wu BN., Kein Rauschen 
0.200 + mm Keine BN., Rauschen 
wem BN., Rauschen 


0.000 =m mm m m 
Tiny Shallow Deep Stretched Split Total 
ResNet ResNet ResNet Deep ResNet ResNet Split ResNet 


F1 Maß 


0.400 4 


(b) »rtf« mit Sequenzlänge 1 080 


1.000 
0.911 4 
0.800 4 
~ 0.600 4 | — — 
© 
= 
dq Regularisierungsmethoden 
4 0.400 + | \ F 
EE Keine BN., Kein Rauschen 
wem BN., Kein Rauschen 
0.200 + mum Keine BN., Rauschen 
wem BN., Rauschen 
0.000 ME EEE En u 


Tiny Shallow Deep Stretched Split Total 
ResNet ResNet ResNet Deep ResNet ResNet Split ResNet 


(c) »rtf« mit Sequenzlänge 1 800 


Abbildung 7.3: Balkendiagramme des F1-Maßes für die verschiedenen Netzarchitekturen bei 
Verwendung der »relative-to-first«(rtf)-Transformation. Außerdem wird der 
Einfluss der Regularisierungsmethoden gezeigt. 
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(c) »rtz« mit Sequenzlänge 1800 


Abbildung 7.4: Balkendiagramme des F1-Maßes für die verschiedenen Netzarchitekturen bei 
Verwendung der »relative-to-zero«(rtz)-Transformation. Außerdem wird der 
Einfluss der Regularisierungsmethoden gezeigt. 
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Um beim Lernen einem Springen um ein Minimum entgegenzuwirken, wird 
die Lernrate immer halbiert, wenn der Validationsfehler sich zwischen zehn 
Lerniterationen nicht verbessert. Das Early-Stopping-Kriterium führt dazu, 
dass das Einlernen des Netzes abgebrochen wird, wenn der Validationsfeh- 
ler über 15 Lerniterationen nicht sinkt. Damit soll eine Überanpassung des 
Netzes verhindert werden. 


Die verschiedenen neuronalen Netzwerkarchitekturen werden auf einem 
AMD Ryzen™ Threadripper™ 1920X 12-Kern-Prozessor mit 64 GB Arbeits- 
speicher und vier Geforce GTX 1080 Ti evaluiert. Jedes Netzwerk wird anhand 
der sechs Datensätze evaluiert. Bei den ResNet-basierten Netzwerken werden 
die Batch-Normalization und das Eingangsrauschen getestet. Die anfängliche 
Lernrate wird auf 0,001 ohne Batch-Normalization und 0,002 mit aktivierter 
Batch-Normalization festgelegt. Die maximale Anzahl der Epochen ist auf 600 
festgelegt. Die Batchgröße wird auf 64, 128 und 256 für die Sequenzlängen 
von 360, 1080 bzw. 1 800 festgelegt. 


Insgesamt werden 144 verschiedene Konfigurationen evaluiert. Darüber hin- 
aus werden vier zusätzliche Netze auf dem Datensatz mit einer Sequenzlän- 
ge von 360 und der »relative-to-first«-Transformation eingelernt: zum einen 
zwei MLPs, zum anderen das »Shallow ResNet« und das »Deep ResNet« oh- 
ne geographische Merkmale. Letztere werden verwendet, um die Auswirkung 
dieser abgeleiteten Merkmale evaluieren zu können. Die Ergebnisse für die 
sechs verschiedenen Architekturen sind in Abbildungen 7.3 und 7.4 darge- 
stellt. Das »Shallow ResNet« hat unter Verwendung einer Sequenzlänge von 
360 und der »relative-to-first«-Transformation das insgesamt beste Ergebnis 
(auch wenn nicht von einem signifikanten Unterschied zum nächstschlech- 
teren Ergebnis gesprochen werden kann). Für diesen Aufbau ist die Konfu- 
sionsmatrix in Tabelle 7.3 dargestellt. Bei einer Sequenzlänge von 360 über- 
trafen sowohl das »Shallow ResNet« als auch das »Deep ResNet« die ande- 
ren Netzarchitekturen. Für die »relative-to-first«-Transformation (siehe Ab- 
bildung 7.3a) hat das »Shallow ResNet« ein F1-Maf von 0,920 und das »Deep 
ResNet« 0,919 erreicht. Unter Verwendung der »relative-to-zero«-Transfor- 
mation (siehe Abbildung 7.4a) erreicht das »Deep ResNet« ein FI-Maß von 
0,918 und das »Shallow ResNet« 0,913. Für beide Transformationen konnte 
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keine Verbesserung der Ergebnisse durch die Regularisierungsmethoden fest- 
gestellt werden. 


Tabelle 7.3: Konfusionsmatrix der »Shallow ResNet«-Architektur unter Verwendung des Daten- 
satzes mit Sequenzlänge 360 und der »relative-to-first«-Transformation. Es wurde 
kein Eingangsrauschen und keine Batch-Normalization benutzt. 


Prädizierte Klasse 


cee Fishing Passenger Pa Tug 
Cargo- 95,1% 1,2% 0,8% 0,8% 2,1% 
Tanker 97 636 1250 831 832 2135 
De 6,2% 89,1% 0,8% 1,3% 2,6% 
g% Fishing 
3 1669 24074 225 343 699 
Z 5,5 % 0,9% 91,0% 1,4% 1,2% 
o Passenger 
5 1700 289 28 284 426 374 
S Pleasure 7,9 % 2,7% 2,4% 84,6 % 24% 
Craft 1148 397 356 12 296 344 
Ti 7,3% 1,5% 0,7% 0,7% 89,8% 
u 
8 3032 637 270 284 37301 


Über alle Experimente hinweg zeigt sich, dass die »relative-to-first«- im Ver- 
gleich zur »relative-to-zero«-Transformation besser abschneidet. Für eine Se- 
quenzlänge von 360 konnten die geteilten ResNet-Architekturen keinen Vor- 
teil aufzeigen. Die Unterschiede sind hier gering. Wie anfangs vermutet ist 
das »Tiny ResNet« nicht mit ausreichend Parametern ausgestattet, sodass es 
nicht die Klassifikationsqualität der anderen Architekturen erreicht. 


Bei längeren Sequenzen können die beiden geteilten ResNet-Architekturen 
»Split ResNet« und »Total Split ResNet« zum Teil bessere Ergebnisse als die 
anderen Architekturen erreichen. So liegt das F1-Maf für eine Sequenzlänge 
von 1080 und die »relative-to-first«-Transformation (siehe Abbildung 7.3b) 
bei Ersterer bei 0,913 und bei Letzterer bei 0,912. Hier konnte die Regularisie- 
rung keine Verbesserung erbringen. Bei der »relative-to-zero«-Transformati- 
on (siehe Abbildung 7.4b) erzielt das »Shallow ResNet« die besten Ergebnisse: 
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zum einen ohne Regularisierung ein F1-Maß von 0,907 und zum anderen mit 
Eingangsrauschen einen Wert von 0,905. 


Für beide Transformationen bei Verwendung der längsten Sequenzen von 
1 800 erreichen die geteilten Netze die besten Ergebnisse. Für die »relative-to- 
first«-Transformation erzielt das »Split ResNet« ein F1-Maß von 0,911 und für 
die »relative-to-zero«-Transformation erreicht das »Total Split ResNet« einen 
Wert von 0,898. In beiden Fällen wurden diese Ergebnisse wieder ohne Regu- 
larisierungsmethoden erreicht. Um zu überprüfen, ob die verwendeten CNNs 
tatsächlich notwendig sind, wurden zusätzliche Tests mit MLPs durchgeführt. 
Die beiden Architekturen wurden mit einer Sequenzlänge von 360 und der 
»relative-to-first«-Transformation eingelernt. Das Training verlief dabei er- 
folglos: Die Netze waren nicht dazu in der Lage, die Charakteristika der Tra- 
jektorien einzulernen, um eine korrekte Klassifikation in dem gewünschten 
Maß durchzuführen. Die beiden Netze haben für jedes Eingangsdatum die 
»Cargo-Tanker«-Klasse als Ausgabe gezeigt. Da diese Klasse die meisten Bei- 
spiele im Datensatz besitzt (siehe Tabelle 7.1), hat das Netz also nur die wahr- 
scheinlichste Klasse eingelernt (dies ergibt ein F1-Maß von 0,304). 


Im Weiteren wurden die »Shallow ResNet«- und »Deep ResNet«-Architek- 
turen mit dem Merkmalsvektor ohne die beiden geographischen Merkmale 
eingelernt. Als Datensatz wurden hierfür wieder eine Sequenzlänge von 360 
und die »relative-to-first«-Transformation gewählt. Die beiden Netze konn- 
ten auf Basis dieser Daten ein F1-Mafs von 0,888 bzw. 0,871 erreichen und 
liegen damit etwa 3,5 % unterhalb der zuvor mit allen Merkmalen erbrachten 
Leistungen. 


74 Schlussfolgerung 


In der Evaluation hat sich herausgestellt, dass die vorgeschlagenen MLP-Ar- 
chitekturen ungeeignet für die vorliegenden Daten sind. Die hohe Dimension 
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selbst der kleinen Sequenzlänge macht die Verwendung der vollständig ver- 
bundenen Netze unpraktikabel (die Anzahl der benötigten Parameter insbe- 
sondere in der ersten verdeckten Schicht ist groß). Durch die weitere händi- 
sche Extraktion von Merkmalen könnte der Lernprozess für ein MLP verbes- 
sert werden. 


Wie erwartet ist das »Tiny ResNet« nicht in der Lage, mit den anderen zu kon- 
kurrieren. Die anderen nicht geteilten ResNet-Architekturen schnitten gut ab, 
insbesondere auch bei kürzeren Sequenzen. In einigen Fällen ist das »Stret- 
ched Deep ResNet« nicht in der Lage, die Klassen zu erlernen. Dies tritt vor 
allem bei der Evaluation mit Batch-Normalization auf. Es ist möglich, dass es 
ein Problem mit der Struktur des Netzes oder der großen Anzahl von Para- 
metern gibt. 


Die »relative-to-first«-Transformation führt im Vergleich zur »relative-to- 
zero«-Transformation zu den besseren Ergebnissen. Dies ist insbesondere 
bei der längsten Sequenzlänge gut sichtbar. Ein Problem könnte sein, dass 
der Endpunkt für die Drehung der Trajektorie verwendet wird. Dadurch 
wird den Daten - insbesondere bei Rundfahrten - eine gewisse Zufälligkeit 
hinzugefügt. 


Es wurde erwartet, dass die kurzen Sequenzen im Vergleich zu den längeren 
Sequenzen schlechter abschneiden würden. Dies hat sich jedoch nicht in der 
Evaluation bestätigt. Hier konnten die Netze, die mit kürzeren Sequenzen trai- 
niert worden waren, bessere Ergebnisse erreichen. Als ein Hauptgrund hierfür 
kann die Anzahl an Sequenzen vermutet werden. Bei den kürzeren Sequenzen 
können deutlich mehr Sequenzen extrahiert werden: Bei einer Sequenzlänge 
von 360 wurden bei der »relative-to-first«-Transformation 2 168 764 Sequen- 
zen extrahiert, bei den Sequenzlängen von 1080 und 1800 nur 486 510 (ca. 
22%) respektive 249 984 Sequenzen (ca. 12%). 


Darüber hinaus kann die häufigere Segmentierung leichter klassifizierbare 
Sequenzen ergeben: Das Verhalten eines Fischerbootes ist dadurch gekenn- 
zeichnet, dass es allgemein drei Phasen gibt. Es fährt aus dem Hafen, beim 
Fischgrund fängt es an zu fischen und am Ende fährt es wieder zurück in den 
Hafen. Das Hin- und Zurückfahren zum Fischgrund hat große Ähnlichkeit zu 
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Bewegungsmustern anderer Schiffstypen, nur der Teil des aktiven Fischens 
ist klar einem Fischerboot zuzuschreiben. Eine aggressivere Segmentierung 
führt zu mehr Fischereisequenzen, die unabhängig von der Beobachtungs- 
dauer leichter zu klassifizieren sind. 


Die geteilten Architekturen sind dazu in der Lage, bei Datensätzen mit länge- 
ren Sequenzen eine bessere Leistung zu erbringen. Diese ist aber ähnlich zu 
der des »Shallow ResNet«. Vergleicht man die Anzahl der Parameter, so hat 
das »Split ResNet« etwa 390 000 Parameter, das »Shallow ResNet« ca. 50 000 
Parameter mehr und das »Total Split ResNet« ca. 25 000 Parameter weniger. 


Nur auf dem Datensatz mit einer großen Anzahl an Sequenzen schneidet das 
»Deep ResNet« gut ab. Dies korreliert mit dem Bedarf an mehr Informationen 
wegen der größeren Anzahl an Parametern. Aufgrund der reduzierten Flexibi- 
lität kann eine geteilte Architektur als eingebrachtes Vorwissen zur Struktur 
der Daten interpretiert werden, das dann wiederum nicht implizit aus den 
Daten extrahiert werden muss. Dies kann zu einer besseren Leistung bei klei- 
neren Datensätzen führen. 


Über die verschiedenen Experimente konnten die vorgeschlagenen Regula- 
risierungsmethoden keine Vorteile bzgl. der Klassifikation erbringen. Durch 
die Batch-Normalization ist die Lernrate jedoch höher und es werden weniger 
Iterationen bis zur Konvergenz benötigt. 


Die erzielten Ergebnisse sind insgesamt vielversprechend. Für weitere Arbei- 
ten sollte aber insbesondere die verwendete Sequenzlänge genauer betrachtet 
werden: In realen Anwendungsfällen kann eine Mindestbeobachtungsdauer 
von einer Stunde zu lang sein, um sinnvoll mit diesem System arbeiten zu 
können. Erste vielversprechende Ergebnisse hierzu wurden bspw. in der Ab- 
schlussarbeit [Har20] erarbeitet. Außerdem könnte eine Interpolation zur Er- 
zeugung von Daten mit gleicher Zeitdifferenz zwischen zwei Datenpunkten 
oder eine Art »Embedding«- oder »Alignment«-Schicht bessere Ergebnisse 
liefern. Von Interesse kann hier insbesondere auch die Betrachtung weiterer 
Informationsquellen sein. 
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8 Bestimmen von Nutzenfunktionen 
- Routenextraktion 


»Wanderer, es gibt keinen Weg, der Weg entsteht im Gehen.« 
— Antonio Machado 


Ergebnisse aus diesem Kapitel wurden im Rahmen der »2018 International 
Conference on Computational Science and Computational Intelligence« 
[Ann18a] vorgestellt. 


8.1 Problem und Zielsetzung 


In Kapitel 6 wurde ein spieltheoretisches Modell eingeführt, mit dem durch 
Vorgabe von charakteristischen Nutzenfunktionen ein bestimmtes Verhalten 
von Schiffen nachgebildet werden kann. Hierzu wurden zunächst verschie- 
dene einfache Nutzenfunktionen, die bestimmte Aspekte des gewünschten 
Verhaltens darstellen, aufgestellt. Eine dieser Funktionen sollte die Route be- 
schreiben. Hierbei wurde die Route als eine Gerade (bzw. als Kombination 
aus linearen Abschnitten) angenommen, von der in einem gewissen Abstand 
ohne Verschlechterung des Nutzens abgewichen werden kann. Erst bei größe- 
ren Abweichungen wird der Abstand immer mehr bestraft. Dies bildet jedoch 
nur bedingt Routen im maritimen Raum ab. Außerdem ist das Aufstellen der 
einzelnen Nutzenfunktionen nicht für jeden Schiffstyp trivial möglich. Daher 
soll in diesem Kapitel die Frage beantwortet werden, wie Routen aus Daten 
extrahiert und in einem sinnvollen Format weiterverarbeitet werden können. 
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Hafengebiete 
48.4°N 4 


Brest 


48.35°N 4 


Île Ronde 


48.3°N 4 jle Longue 


Lanvéoc 


4.6°W 4.5°W 4.4°W 


Abbildung 8.1: Das untersuchte Gebiet um Brest, Ile Longue und Lanvéoc. Das Hafengebiet um 
Brest ist durch das von der Mole geschützte Hafenbecken gegeben, während die 
anderen Häfen durch Kreise approximiert werden. 


Bei der Modellierung von Routen müssen unterschiedliche Kriterien beachtet 
werden, um die erstellten Abbildungen sinnvoll weiter verwenden zu können. 
Im Allgemeinen sollte eine Darstellung wenig Speicherplatz benötigen sowie 
originalgetreu und robust gegenüber Ausreißern in den zugrundeliegenden 
Daten sein. Im Folgenden werden zur Verdeutlichung einiger Herausforde- 
rungen verschiedene Ergebnisse zu den Routen zwischen Brest und Lanvéoc 
(siehe Abbildung 8.1) sowie dem Verkehr auf der Straße von Dover (siehe 
Abbildung 8.3) basierend auf Verfahren aus der Literatur vorgestellt. Die Da- 
ten zum ersten Fall entstammen dem Naval-Academy-Brest-Datensatz, die des 
zweiten Szenarios aus dem IOSB-AISHub-Datensatz. 


In den Abbildungen 8.2a und 8.2b werden zwei Beispiele für die Speicherung 
von Routen, wie sie in [Pal13a] verwendet werden, gezeigt. Für Abbildung 8.2a 
wird eine adaptive KDE verwendet. In Abbildung 8.2b werden Alpha-Shapes 
genutzt, um die Route über ein Polygon zu beschreiben. Bei einer Alpha-Shape 
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handelt es sich um eine Verallgemeinerung des Konvexitatskonzepts, d. h., je- 
de konvexe Hülle ist eine Alpha-Shape, aber nicht jede Alpha-Shape ist eine 
konvexe Hülle. 


Alpha-Shapes sind wie folgt definiert: Nach [Ede83] gilt zunächst für eine ver- 
allgemeinerte Kreisscheibe mit einem Radius 1/a: 


1 Für æ > 0 entspricht sie einer Kreisscheibe mit Radius 1/a. 
2 Für a = 0 entspricht sie einer Halbebene. 


3 Für a < 0 entspricht sie dem Komplement einer Kreisscheibe mit 
Radius —1/a. 


Ein Punkt p in einer Menge S wird dann als @-extrem in S bezeichnet, wenn 
es eine abgeschlossene verallgemeinerte Kreisscheibe mit Radius 1/a gibt für 
die p aufdem Rand der Kreisscheibe liegt und die Kreisscheibe alle Punkte aus 
S enthält. Zwei a-extreme Punkte p und q heißen dann a-Nachbarn, wenn es 
eine abgeschlossene verallgemeinerte Kreisscheibe mit Radius 1/« gibt, für 
die p und q auf dem Rand liegen und die alle anderen Punkte beinhaltet. Ei- 
ne Alpha-Shape für eine Menge S ist dann ein Graph, dessen Knoten durch 
a-extreme Punkte gegeben sind und dessen Kanten jeweils a-Nachbarn mit- 
einander verbinden. 


Der tatsächliche Verlauf der abgebildeten Routen sollte durch einen Algorith- 
mus möglichst gut erfasst werden. Dazu gehört, dass Seewege nicht über Land 
verlaufen: In beiden Abbildungen kann ein Überqueren von Inseln und teil- 
weise größeren Landmassen erkannt werden. Insbesondere die Insel Île Ronde 
(siehe auch Abbildung 8.1) befindet sich in ihrer Gesamtheit innerhalb der ge- 
zeigten Alpha-Shapes sowie in einem Gebiet mit einer hohen Log-Likelihood. 


Bedingt durch kleine Inseln, aber auch Untiefen und Sandbänke kann sich 
eine Seeroute aufspalten. Als ein Beispiel sei hier die Varne-Bank in der Stra- 
ße von Dover genannt. Der Verlauf der Sandbank und der umliegenden Ver- 
kehrsrouten ist in Abbildung 8.3 dargestellt. Da Schiffe in solchen Fällen im 
Allgemeinen nicht unbeschadet durch die Sandbank fahren können, spaltet 
sich der Verkehr hier auf. Solche Faktoren sollten auch für eine originalge- 
treue Abbildung der Routen bedacht werden. 
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—— Aufgezeichnete Daten 
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(a) Adaptive KDE für æ = 0,5 (b) Alpha-Shapes 


Abbildung 8.2: Darstellung einer Route basierend auf verschiedenen Verfahren 


Auf bestimmten Routen kann die Anzahl der Schiffe, die diese befahren, ge- 
ring sein, was dazu führt, dass nur wenige Trajektorien für diese Route zur 
Verfügung stehen. Ein anderes Problem besteht darin, dass nur über einen 
gewissen Zeitraum Daten erfasst werden können oder dass eine nachträgli- 
che Erfassung nicht möglich ist (bspw. würde sich aufgrund von saisonalen 
Effekten die Möglichkeit für weitere Messungen erst Monate später wieder er- 
geben), was zu der gleichen Ausgangslage führen kann. Daher ist es wichtig, 
dass der Algorithmus trotz der spärlichen Datengrundlage eine aussagekräf- 
tige Darstellung erzeugt. 


Im Vergleich zum Straßenverkehr muss ein Schiff nicht unbedingt einem 
bestimmten Weg starr folgen und kann von diesem auch erheblich abwei- 
chen. Dennoch sollte eine solche Trajektorie als Teil eines größeren Clusters 
betrachtet werden. In Abbildung 8.2b sind mehrere Schiffe erkennbar, die 
weit vom allgemeinen Verhalten abweichen. Diese Ausreißer sollten auch 
berücksichtigt werden, jedoch sollte der Einfluss nicht zu groß sein: In 
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Abbildung 8.2b ist der Einfluss auf die Alpha-Shapes groß, während in 
Abbildung 8.2a der Einfluss nur gering ausfällt. 


BE Verkehrstrennungsgebiete Fi 
EE Varne-Sandbank J 
EE Sandettie Bank a A 
51.2°N4 Fa FA 
Dover @ Pi a | 
A 
Z 
Calais @ 
0.7°E 0.9°E 1.1°E 1.3°E 1.5°E 1.7°E 1.9°E 


Abbildung 8.3: Die Varne-Sandbank in der Straße von Dover. Im Gegensatz zu anderen Sand- 
bänken, wie der eingezeichneten Sandettie Bank, ist die Varne-Sandbank Teil des 
durch das Verkehrstrennungsgebiet vorgegebenen, zu befahrenden Bereichs. Die 
Sandettie Bank hingegen liegt im markierten Teil des nicht zu durchfahrenden 
Gebietes (Ähnliches gilt bspw. auch für die Colbart Bank) und wurde hier nur 
für eine klarere Positionierung farblich abweichend zum restlichen Verkehrs- 
trennungsgebiet markiert. 


82 Methodik 


Ein Cluster wird durch das ähnliche Verhalten der in ihm zusammengefassten 
Trajektorien definiert. Um die Cluster zu identifizieren, können verschiedene 
Algorithmen verwendet werden. Eine Variante besteht darin, die Cluster auf 
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Basis von Orten von Interesse zu erstellen. Dies sind im maritimen Raum ins- 
besondere Häfen und andere Anlegestellen, für die Überwachung eines spe- 
zifischen Gebiets aber auch die Ein- bzw. Ausgänge aus diesem Gebiet. Ha- 
ben zwei Trajektorien die gleichen Start- und Endpunkte, können diese einem 
Cluster zugeordnet werden. Hier werden Häfen in Brest, Ile Longue und Lan- 
veoc im Aufnahmegebiet des Naval-Academy-Brest-Datensatzes (siehe Abbil- 
dung 8.1) als Grundlage verwendet, um die Trajektorien zu clustern. 


Um die Qualität der Cluster zu verbessern, werden die Trajektorien innerhalb 
eines Clusters miteinander verglichen. Dafür wird hier die Hausdorff-Metrik 
[Hau02] verwendet. Da Trajektorien innerhalb eines Clusters möglichst ähnli- 
ches Verhalten aufweisen sollen, ist ihr Abstand zueinander gering. Der Haus- 
dorff-Abstand ist wie folgt definiert: Für zwei nichtleere Untermengen X und 
Y eines metrischen Raums (M, d) gilt für ihren Abstand zueinander 


dy(X,Y) = max į sup inf d(x,y), sup inf d(x,y) ¢. (8.1) 
xex vey yey xEX 


Es wird nun für jede Trajektorie im Cluster zu jeder anderen Trajektorie der 
Abstand bestimmt. Sollte der Abstand einer Trajektorie zu keiner anderen 
Trajektorie unter einem zuvor festgelegten Schwellwert liegen, so wird diese 
aus dem Cluster entfernt. Wenn nur die Positionsdaten zweier Trajektorien 
unter Verwendung der Hausdorff-Metrik verglichen werden, wird die Rich- 
tung der Trajektorie ignoriert (beide Trajektorien werden als Mengen inter- 
pretiert, sodass die Verbindung zwischen den Punkten in einer Trajektorie 
nicht berücksichtigt wird). Dieses Problem wird dadurch umgangen, dass die 
Trajektorien in einem Cluster durch ihren Anfang und ihr Ende zusammenge- 
fasst werden und somit nur Trajektorien in einer Fahrtrichtung miteinander 
verglichen werden. 


Die Cluster werden ähnlich zu den Arbeiten von Guillarme und Lerouvreur 
[Guil3] in Segmente aufgeteilt. Für jedes Segment werden der arithme- 
tische Mittelwert und die Standardabweichung jeweils für die Position, 
die Geschwindigkeit und den Kurs ermittelt. Im Fall eines Aufspaltens der 
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Trajektorie aufgrund von Untiefen etc. werden fiir alle Teilsegmente diese 
Statistiken einzeln bestimmt. 


Zunachst werden fiir alle Trajektorien in einem Cluster B-Splines [Boo72] be- 
stimmt. Im nachsten Schritt werden die Splines an n Punkten abgetastet. Die- 
se Abtastwerte müssen nicht äquidistant gewählt werden: Ein B-Spline kann 
an einem beliebigen Punkt i im normalisierten Intervall [0,1] zwischen dem 
Start- und Endpunkt ausgewertet werden. Da die Schiffe in der Nähe eines 
Ortes von Interesse eine größere Varianz in ihrem Verhalten zeigen, werden 
die Segmente in der Nähe des Start- und Endpunktes kleiner gewählt. Die Ab- 
tastung f : i > [0,1] für einen Punkt i € {1,...,n}undn = 2j +1,Yj € Nt 
wird wie folgt beschrieben: 


sd =4 (5) (8.2) 


ro = ae i<n/2 


1-g(n-1-i), i>n/2° (8.3) 


Im nächsten Schritt wird für jedes Segment ein Anderson-Darling-Test mit ei- 
nem Signifikanzniveau von 5% durchgeführt. Da der Test auswertet, ob die 
Stichproben aus einer gegebenen Wahrscheinlichkeitsverteilung (hier als An- 
nahme eine Normalverteilung) gezogen werden, zeigt er an, ob eine einzige 
Normalverteilung ausreicht, um das Segment zu repräsentieren. In diesem Fall 
wird dann also eine Normalverteilung der Daten im Segment angenommen 
und an die Daten angepasst. 


Wenn der Anderson-Darling-Test fehlschlägt, wird für jedes Segment ein GMM 
mit einer festen Anzahl von Komponenten geschätzt. Unter Verwendung der 
Energy-Distance [Szé04, Sze05, Bar04] wird der Abstand zwischen den Nor- 
malverteilungen der einzelnen Komponenten berechnet: Die Energy-Distance 
zwischen den Verteilungen U und V ist wie folgt definiert: 


D(U, V? =2 E||X -Y||-E|X —X’||-E||Y -—Y’|| > 0, (8.4) 
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mit den unabhängigen Zufallsvariablen X, X’, Y, Y’ und der kumulierten Ver- 
teilungsfunktion U für X und X’ bzw. V für Y und Y’. Mit || - || wird die 
euklidische Norm beschrieben. Wenn der Abstand kleiner als ein bestimmter 
Schwellwert ist, wird ein neues GMM mit weniger Komponenten bestimmt. 
Das Ergebnis dieser Schätzung wird dann zur Modellierung des Gesamtver- 
haltens der Schiffe im Cluster verwendet. Wenn mehr als eine Komponente 
vorhanden ist, führt dies zu einer Aufteilung der Trajektorien. 


Schließlich werden die verschiedenen Segmente zu einem Graphen verbun- 
den, der das Verhalten im Cluster darstellt. Dieser Graph kann auch die 
Wahrscheinlichkeit enthalten, dass ein Schiff einem bestimmten Unterseg- 
ment folgt. Für jedes Segment (und Subsegment) in der Route werden der 
arithmetische Mittelwert und die Standardabweichung jeweils für die Positi- 
on, den Kurs über Grund und die Geschwindigkeit über Grund gespeichert. 


8.3 Ergebnis 


In Abbildung 8.4 sind Beispiele für die aus den jeweiligen Daten generierten 
Routen dargestellt. Hierbei sind für die Segmente jeweils das 10- (grün), 20- 
(gelb) und 30-Intervall (rot) eingezeichnet. 


Im Vergleich zu den anderen Darstellungen in den Abbildungen 8.2a und 8.2b 
befindet sich die Insel fle Ronde nahezu vollständig außerhalb der in Abbil- 
dung 8.4a gezeigten Route zwischen Brest und Lanvéoc. Auch das Beispiel in 
Abbildung 8.4b zeigt, dass der Verlauf der Route gut abgebildet wird und ins- 
besondere Landmassen umgangen werden und die Kurve beim Verlassen des 
Hafens gut wiedergegeben wird. In Abbildung 8.4c beginnt die Route im Osten 
und führt nach Westen. Sie teilt sich nach etwa einem Viertel der gezeigten 
Länge vor der Varne-Sandbank in zwei Teile auf. Die gezeigte Route bildet 
dieses Verhalten gut ab und ihre Teile kommen nach der Varne-Sandbank 
wieder zusammen. 


146 


8.4 Schlussfolgerung 


— 1a intervall Hafengebiete 
2a intervall — Aufgezeichnete Daten 
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(a) Route zwischen Brest und Lanvéoc (c) Route um die Varne-Sandbank 


Abbildung 8.4: Beispielergebnisse zu dem Routenextraktionsverfahren 


8.4 Schlussfolgerung 


In diesem Kapitel wurde dargestellt, wie Routen für das in Kapitel 6 vorge- 
stellte spieltheoretisch motivierte Verhaltensmodell erstellt werden können. 
Hierbei wird davon ausgegangen, dass das Verhalten in verschiedene quantifi- 
zierbare Teilnutzenfunktionen aufgespalten werden kann, um so das Gesamt- 
verhalten zu beschreiben. Für viele Schiffstypen ist dieses Vorgehen vielver- 
sprechend, jedoch zeigen bspw. Fischerboote in Teilen ihrer Fahrt ein weniger 
berechenbares Verhalten. Es fehlt also die Möglichkeit, das Gesamtverhalten 
durch die vorhandenen Daten zu approximieren. 
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9 Bestimmen von Nutzenfunktionen 
— Inverse Reinforcement-Learning 


»Tiefes Wissen heißt, der Störung vor der Störung gewahr 


sein.« 


— Sunzi 


Ergebnisse aus diesem Kapitel wurden im Rahmen eines Workshops zum The- 
ma künstliche Intelligenz in der Modellierung auf der »Modellierung 2020« 
[Ann20a] vorgestellt sowie in der Abschlussarbeit [Mar19] betreuend erar- 
beitet. 


9.1 Problem und Zielsetzung 


In Kapitel 8 wurde gezeigt, wie Routen aus Daten extrahiert werden können, 
um diese in anderen Verfahren bereitzustellen. Im nächsten Schritt soll hier 
gezeigt werden, wie Nutzenfunktionen für komplexeres Verhalten aus Daten 
abgeleitet werden können. Dabei werden aufgrund ihres unterschiedlichen 
Verhaltens Fischerboote und Frachtschiffe untersucht. 
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9.2 Methodik 


Zunächst werden benötigte Grundlagen zum Thema (Inverse) Reinforcement- 
Learning eingeführt. Insbesondere werden hier Arbeiten vorgestellt, auf de- 
nen der gewählte Ansatz basiert, sowie deren Funktionsweisen erklärt. Im An- 
schluss wird erläutert, wie die Vorverarbeitung der AIS-Daten abläuft, um die 
geographischen Informationen für den Algorithmus zugänglich zu machen. 


9.2.1 Inverse Reinforcement-Learning 


Das Reinforcement-Learning (dt. »bestarkende Lernen«) steht für eine Gruppe 
maschineller Lernverfahren. Anders als beim überwachten Lernen (ein Mo- 
dell wird auf Basis von annotierten Ein- und Ausgangsdaten eingelernt) und 
beim unüberwachten Lernen (ein Modell wird ohne weitere Informationen 
aus den Daten extrahiert) wird beim bestärkenden Lernen ein bestimmtes 
Verhalten für einen Agenten auf Basis einer Nutzenfunktion (engl. »utility 
function«) eingelernt. Die Nutzenfunktion bewertet dabei die Aktionen des 
Agenten. Solche Funktionen werden häufig von Hand für das vorliegende 
Problem zugeschnitten und können direkt zum Einlernen oder Prädizieren 
des Agentenverhaltens genutzt werden. 


Das Inverse Reinforcement-Learning (IRL) beschreibt den inversen Ansatz: Es 
soll eine Nutzenfunktion abgeleitet werden, die das Verhalten des Agenten 
möglichst gut imitiert. Als ein IRL-Ansatz wurde das Lernen einer Nutzen- 
funktion auf Basis von Expertentrajektorien von Ng und Russell in ihrer Ar- 
beit [Ng00] eingeführt. Dieser erste Ansatz hatte einige Unzulänglichkeiten: 
unter anderem eine unzureichende Heuristik, um sich für eine Nutzenfunkti- 
on zu entscheiden, und die Beschränkung auf kleine Zustandsräume. 


Ausgehend von dieser Idee stellen Ziebart et al. [Zie08] einen Ansatz ba- 
sierend auf der maximalen Entropie vor: Für das Maximum-Entropy Inver- 
se Reinforcement-Learning (MaxEntIRL) wird die maximale Entropie als ent- 
scheidender Faktor der Nutzenfunktion eingeführt. Die maximale Entropie 
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beschreibt hierbei die Menge der Annahmen über die Funktionen. Die Au- 
toren zeigen, dass die Verwendung der geringsten Anzahl von Annahmen zur 
allgemeinsten Nutzenfunktion führt. 


Auf Basis des Prinzips des MaxEntIRL prädizieren Hirakawa et al. [Hir18] 
die Flugbahnen von Vögeln (Sturmtaucher), indem sie die zugrundeliegende 
Nutzenfunktion approximieren. Sie verwenden GNSS-Daten, die bei Vogel- 
flügen gesammelt wurden, um Merkmalskarten in Abhängigkeit vom aktuel- 
len Geländetyp zu erstellen. Anschließend werden diese Merkmalskarten zur 
Vorhersage von Trajektorien verwendet. Der Faktor Zeit wird hierbei explizit 
modelliert und als Teil des Zustands abgebildet. Die Dimension des Zustands- 
raums vergrößert sich damit enorm, jedoch ermöglicht dies auch indirekte 
Trajektorien der Sturmtaucher zu prädizieren. Diese Möglichkeit einer indi- 
rekten Trajektorie ist auch für die Abbildung des Schiffsverkehrs gerade für 
komplexere Verhaltensmuster von großer Bedeutung. Daher wird im Folgen- 
den dieser Ansatz für das Modellieren des Schiffsverhaltens adaptiert. 


Analog zu den Vögeln in [Hir18] werden hier die einzelnen Schiffe als Agen- 
ten modelliert. Wie in Abschnitt 4.2.1 erläutert, nimmt ein Agent seine Um- 
gebung wahr und führt Aktionen durch, um diese zu beeinflussen. Die durch 
Sensoren erfassten Informationen werden verwendet, um eine interne Re- 
präsentation aller wichtigen Entitäten um den Agenten herum aufzubauen. 
Basierend auf diesem Zustand wird der Agent Aktionen zur Veränderung 
der Umgebung durchführen. Die Übergänge zwischen den Zuständen müs- 
sen nicht deterministisch sein. 


Im Gegensatz zu dem in Kapitel 6 verwendeten nutzenbasierten Agenten 
(siehe Abbildung 4.2) entspricht das Reinforcement-Learning einem ler- 
nenden Agenten. Der schematische Aufbau eines solchen Agenten ist in 
Abbildung 9.1 dargestellt. 
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Abbildung 9.1: Aufbau eines lernenden Agenten nach [Rus10, S. 55] 


Die Ein- und Ausgänge in Form der Sensorik und Aktorik, um die Umwelt 
wahrnehmen und mit ihr interagieren zu können, sind identisch zu den vor- 
herigen Agentenmodellen. Von großer Bedeutung für einen lernenden Agen- 
ten ist die Wechselwirkung zwischen den beiden Komponenten Performance- 
Element und Learning-Element. Ersteres ist für die Aufnahme der Sensorinfor- 
mationen und die Auswahl der Aktion sowie deren Ausführung verantwort- 
lich. Letzteres erhält über die Critic-Komponente Rückschlüsse über die Leis- 
tung des Agenten und entscheidet, welche Änderungen in das Performance- 
Element einfließen sollen, um zukünftig bessere Leistungen zu erzielen. Die 
letzte Komponente, der Problem-Generator, soll Aktionen vorschlagen, die zu 
neuen informativen Erfahrungen für den Agenten führen. Die Idee hierbei ist, 
dass das Performance-Element ohne weiteres Eingreifen immer nur die derzeit 
beste Strategie weiterverfolgen würde. Durch Abweichungen und Explorie- 
ren werden auch Aktionen durchgeführt, die zwar zunächst einen geringeren 
Nutzen versprechen, aber auf längere Sicht dieses Defizit ggf. kompensieren 
können und einen größeren Nutzen erreichen. Es wird damit also möglich, 
lokale Optima zu umgehen. 
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Als Basis fiir das Reinforcement-Learning wird von einem Markov-Entschei- 
dungsproblem (MEP) ausgegangen. Dieses besteht aus dem Tupel (Q, B, Pg, u) 
mit 

e dem Zustandsraum Q als Menge der möglichen Zustände, 


« dem Aktionsraum B als Menge der möglichen Aktionen des Agenten, 


« der Belohnungsfunktion (engl. »reward-function«) u, die jedem 
Übergang zwischen zwei Zuständen eine Belohnung zuordnet, und 


« dem Aktionsmodell (bzw. der Übergangswahrscheinlichkeit) Pg, die 
für jede Aktion die Wahrscheinlichkeit angibt, von einem Zustand in 
einen anderen zu wechseln. 


Zusätzlich wird häufig ein Discount-Faktor eingeführt, um abnehmende Be- 
lohnungen zu generieren. Ein MEP erfüllt die Markov-Eigenschaft, d.h., der 
nächste Schritt hängt nur vom aktuellen Zustand und von der gewählten Ak- 
tion ab. Die Lösung eines MEP wird als Policy (dt. »Strategie«) bezeichnet und 
bildet im deterministischen stationären Fall jeden Zustand aufeine Aktion ab: 


mria-8B (9.1) 


Im Allgemeinen wird aber von einer stochastischen Policy ausgegangen. Hier 
ist dann eine Policy keine Abbildung auf eine einzelne Aktion, sondern ei- 
ne Wahrscheinlichkeitsverteilung über die möglichen Aktionen. Diese Wahr- 
scheinlichkeitsverteilung tiber die Aktionen gleicht den gemischten Strate- 
gien im Bayes-Spiel (vgl. Abschnitt 4.2.2). Eine Verallgemeinerung des MEP 
ist das von Shapley als stochastisches Spiel [Sha53] vorgestellte Modell für 
kompetitive Ausgangssituationen mit mehr als einem Entscheider. 


Beim Reinforcement-Learning lernt ein Agent auf Basis einer gegebenen Be- 
lohnungsfunktion u eine optimale Policy 7. Im Vergleich dazu ist beim IRL 
die Belohnungsfunktion u gesucht. Es wird versucht, mit Hilfe einer Men- 
ge Z an Expertentrajektorien ¢ = (X1, X32, ... , Xn), die durch eine unbekannte 
optimale Policy 7 generiert wurden, die Belohnungsfunktion u zu erlernen. 
Jede Trajektorie ¢ wird durch die aufeinanderfolgenden Zustände x; € Q be- 
schrieben. Der Zustand setzt sich hierbei aus der zweidimensionalen Position 
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(xi, yi) und einem diskreten Zeitstempel t; zusammen: 


Xi = (Xi, Yı t)". (9.2) 


Die Belohnungsfunktion wird hier als Linearkombination ihrer Merkmale an- 
genommen: 


u(g,0) = >) 67 £(x)). (9.3) 


xjet 


Hierbei ist f(x; ) ein Merkmalsvektor für den Zustand x; und @ ein Gewich- 
tungsvektor. Verkürzt ist £(¢) die Summe über alle Zustände in der Trajektorie 
¢ für ein Merkmal: 


fg) = )) fo). (9.4) 


xjet 


Nach Hirakawa et al. [Hir18] lasst sich dann der Erwartungswert der Beloh- 
nung wie folgt bestimmen: 


Ep,(¢) [uß; 0)] = Ep.) | > 2 (9.5) 
xjeg 
= 0" Ep HF. (9.6) 


Dabei bezeichnet P,,(¢) die Wahrscheinlichkeit des Auftretens einer Trajek- 
torie ¢ unter der Voraussetzung der Policy x. Der Erwartungswert über den 
Merkmalsvektor Ep_(c) [f(¢)] wird im nächsten Schritt mit Hilfe der Menge 
der aufgezeichneten Trajektorien Z geschatzt: 


Epo O] x zZ 2O =f (0.7) 
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Nach [Ng00] ergibt dies eine Menge an Lösungen, die auch degenerierte Be- 
lohnungsfunktionen enthalten, z.B. u = 0. Daher ist eine Filterung der Lö- 
sungen durch eine geeignete Heuristik erforderlich. Hier wird dazu analog 
zu [Hir18] auf das durch [Zie08] eingeführte Lösungskonzept des MaxEntIRL 
zurückgegriffen. 


MaxEntIRL ist eine Erweiterung zum allgemeinen IRL-Ansatz. Hierbei wird 
die Lösung unter Zuhilfenahme der maximalen Entropie (siehe [Jay57] für 
weitere Informationen zum Begriff der Entropie) bestimmt: Beim MaxEntIRL 
werden die möglichen Pfade des MEP als eine Wahrscheinlichkeitsverteilung 
definiert. Während viele Pfade existieren, die dem Erwartungswert aus Glei- 
chung (9.6) entsprechen, sollen durch die Verwendung der maximalen Entro- 
pie [Jay57] die Pfade, die höhere Belohnungen erbringen, mit einer höheren 
Wahrscheinlichkeit gewählt werden. Daraus ergibt sich die Wahrscheinlich- 
keitsverteilung mit der Partitionierungsfunktion P aus [Zie08, Hir18] zu 


P€ 0) = 5 a | > a) (9.8) 
xjeg 


line) 
hrexp oe eP f(x) dé" l 


(9.9) 


Durch Maximierung der Log-Likelihood können dann die optimalen Gewich- 
te 6 bestimmt werden: 


r 1 


0 = arg max L(@) = arg max — > logP,.(g | 9). (9.10) 
8 8 IZ| gez 
Damit ergibt sich der Gradient zu 
VLO =f- D PEIO =F- E D flay Dex) (9.11) 
CEZ SEZ xjee 
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mit D; als Erwartungswert der Zustandsbesuchsfrequenz. Nach [Zie08] kann 
der Erwartungswert der Zustandsbesuchsfrequenz mit Hilfe von Vorwärts- 
und Rückwärtsdurchgängen approximiert werden. Der Algorithmus rechnet 
von Endzuständen rückwärts und verfolgt die mit jedem Zweig verbundene 
Wahrscheinlichkeitsmasse durch Berechnung der Partitionierungsfunktion P. 
Dies führt zu Zustandshäufigkeiten, die sich zu den Gesamthäufigkeiten ad- 
dieren. 


Nach [Kiv97] werden die Gewichte unter Verwendung des Gradienten mit 
der Lernrate A nach der Vorschrift 


© — Oexp(AVL(9)) (9.12) 


aktualisiert, bis sie konvergieren. 


9.2.2 Extraktion der Trainingsdaten 


Für die Versuche werden Trajektorien aus dem Naval-Academy-Brest-Daten- 
satz (siehe Abschnitt 3.2.3) verwendet. Zur weiteren Nutzung im vorgestellten 
MaxEntIRL-Ansatz werden die folgenden Vorverarbeitungsschritte durchge- 
führt: 


Filtern nach Schiffstyp: Es sollen zunächst nur Fischerboote und Frachtschif- 
fe analysiert werden, da diese jeweils distinktive Verhaltensmuster auf- 
weisen. Es werden also alle anderen Schiffstypen herausgefiltert. 


Aufteilen nach Länge: Da die vollständigen Trajektorien der Schiffe zum Trai- 
nieren nicht geeignet sind, werden diese anhand ihrer Länge aufgeteilt. 
Da kürzere Trajektorien einen kleineren Zustandsraum ergeben, wird 
u. a. auch der Lernprozess dadurch beschleunigt. Außerdem sorgt dieser 
Schritt dafür, dass stark verrauschte Trajektorien (wie sie nach [Sot17] 
häufig bei AIS-Daten vorkommen) häufig an diesen Stellen in zwei kür- 
zere Trajektorien aufgeteilt werden. 
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Aufteilen nach Zeit: Die Trajektorien werden anhand eines Schwellwertes 
nach ihrer Zeitkomponente aufgeteilt. Dies führt u. a. dazu, dass Schif- 
fe, die im oder vor dem Hafen vor Anker liegen und sich nur auf ihrem 
Schwojekreis bewegen, als einzelne Trajektorien aufgefasst werden. 


Position auf Fluss: Schiffe mit mehr als 80 % ihrer Trajektorie auf einem Fluss 
werden herausgefiltert. Die Idee ist, das Verhalten von Schiffen auf ho- 
her See und nicht das eingeschränkte Verhalten auf Flüssen zu analy- 


sieren. 


Abbilden auf ein Raster: Ein kontinuierlicher Zustandsraum wäre nicht prak- 
tikabel. Daher wird die Position diskretisiert. 


Aufteilen von Rundfahrten: Für den MaxEntIRL-Ansatz stellt sich eine Start- 
position, die sehr nah an oder exakt auf der Endposition liegt, als ein 
Problem dar. Bei Rundfahrten von Fähren, die zwischen bspw. zwei In- 
seln pendeln, würde eine Schätzung nach dem MaxEntIRL-Ansatz ei- 
ne direkte Verbindung zwischen Start- und Endposition ergeben, an- 
statt den gesamten Verlauf zu schätzen. Um dies zu verhindern, werden 
Rundfahrten aufgeteilt. 


Filtern von kurzen Trajektorien: Wenn eine Trajektorie nicht eine Mindestan- 
zahl an Rasterzellen belegt, wird diese aus dem Trainingsdatensatz ent- 
fernt. 


9.2.3 Erstellen der Merkmalskarten 


Im beschriebenen MaxEntIRL-Ansatz werden Merkmalskarten f zur Bewer- 
tung eines Zustands x verwendet. Die zeitliche Komponente wird hierbei ana- 
log zu dem Vorgehen in [Hir18] nicht innerhalb der Merkmalskarten betrach- 
tet. Eine Merkmalskarte f ist jeweils eine Abbildung des Zustands x auf eine 
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reelle Zahl, die den jeweiligen Nutzen gegeben den bestimmten Eigenschaf- 
ten der Umwelt fiir den Zustand darstellt. Die Linearkombination aller Merk- 
malskarten unter Verwendung einer Gewichtung 9 bildet dann nach Glei- 
chung (9.3) den Nutzen bzw. die Belohnung u für den Agenten. Zum Ablei- 
ten geographischer Informationen werden die gleichen Shapefiles wie in Ab- 
schnitt 7.2.1.4 verwendet. Die für diese Untersuchung erstellten Merkmals- 
karten sind in Abbildung 9.2 dargestellt. 


Im Folgenden wird auf die einzelnen Arten von Merkmalskarten eingegangen: 


00 

-02 
-0.4 
-0.6 
-08 
-10 


(a) Konstante Merkmalskarte (b) Küsten Merkmalskarte 
(c) Fischereikarte (d) Verkehrstrennungsgebiet 
g Dan? zur Küste (£ u Distans zur Küste = Distanz zur Küste 
= 0,1 = 0,5 = 1,0 
(h) Distanz zur Kiiste (i) Distanz zur Kiiste (j) Distanz zur Kiiste 
invertiert y? = 0,1 invertiert y? = 0,5 invertiert y? = 1,0 


Abbildung 9.2: Die fiir das Inverse Reinforcement-Learning verwendeten Merkmalskarten f(x). 
y entspricht dem Parameter einer gaußschen RBF nach Gleichung (9.13). 
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Konstante Merkmalskarte: Mit der in Abbildung 9.2a abgebildeten Merkmals- 
karte sollen längere Trajektorien bestraft werden. Durch höhere Ge- 
wichtung dieses Merkmals werden also kürzere Trajektorien bevorzugt. 


Küsten-Merkmalskarte: Da die Schiffe auf See analysiert werden, wird das in 
Abbildung 9.2b dargestellte Merkmal eingeführt. Es bestraft jede Posi- 
tion über Land. 


Merkmalskarte auf Basis der Fischereikarte: Die in Abbildung 3.7b gezeigte 
Fischereikarte wird benutzt, um eine Merkmalskarte wie in Abbil- 
dung 9.2c gezeigt abzuleiten. 


Merkmalskarte auf Basis der Verkehrstrennungsgebiete: Durch die vorgegebe- 
nen Verkehrstrennungsgebiete soll der Schiffsverkehr koordiniert und 
eine sichere Fahrt gewährleistet werden. In Abbildung 9.2d ist die auf 
Basis von OpenSeaMap'-Daten abgeleitete Merkmalskarte zu sehen. 


Merkmalskarten auf Basis der Distanz zur Küste: Auf Basis der Küstenlinie 
werden verschiedene Merkmalskarten extrahiert, die den Abstand zur 
Küste bewerten. Dazu wird die gaußsche Radiale Basisfunktion (RBF) 

-(2)2 
po(x)=e Y (9.13) 
mit unterschiedlichen Parametern y? € {0,1,0,5,1,0} verwendet. Die 
Karten zur Belohnung eines größeren Abstands sind in den Abbildun- 
gen 9.2h bis 9.2j dargestellt. Da Schiffe aber häufig in einem gewissen 
Abstand zur Küste fahren, werden zusätzlich Merkmalskarten gene- 


riert, die einen kleinen Abstand zur Küste belohnen. Diese sind in den 
Abbildungen 9.2e bis 9.2g dargestellt. 


* https://www.openseamap.org, letzter Abruf am 04.03.2020. 
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9.3 Ergebnis 


In Abbildung 9.3 sind die unterschiedlichen Gewichte 6 fiir Containerschiffe 
und Fischerboote in Blau respektive Orange dargestellt. Um Trajektorien tiber 
Land zu vermeiden, liegt das größte Gewicht für beide Typen auf der Merk- 
malskarte der Küste (siehe Abbildung 9.2b) sowie auf den inversen Distanzen 
zur Küste. Eine Begründung für die hohe Gewichtung der Letzteren liegt dar- 
in, dass die Schiffe einen gewissen Abstand zur Küste einhalten wollen, aber 
nicht zu weit von dieser entfernt fahren wollen. Insbesondere fahren Fischer- 
boote im Vergleich zu den Containerschiffen näher an der Küste. Dies spiegelt 
sich in der jeweils höheren Gewichtung ebendieser Merkmalskarten wider. 


Die Merkmalskarte auf Basis des Verkehrstrennungsgebiets (siehe Abbil- 
dung 9.2d) hat in beiden Fällen ein geringes Gewicht. Das Problem hierbei 
ist, dass es in dem untersuchten Gebiet nur ein kleines offizielles Verkehrs- 
trennungsgebiet gibt, das relativ weit entfernt von der Küste liegt. In dieser 
Entfernung gibt es aber im zugrundeliegenden Datensatz nur wenige aufge- 
zeichnete Trajektorien (vgl. dazu auch Abbildung 3.7a für eine Darstellung 
des im Datensatz vorhandenen Verkehrs). Die eher geringe Gewichtung der 
konstanten Merkmalskarte (siehe Abbildung 9.2a) lässt sich unter anderem 
damit begründen, dass die anderen Merkmalskarten bereits zu einer Bestra- 
fung von längeren Trajektorien führen und damit die explizite Bestrafung 
nicht benötigt wird. 
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Abbildung 9.3: Resultierende Gewichte 6 für die Merkmalskarten f(x) 


Durch die Kombination der gewichteten Merkmalskarten unter Verwendung 
der Gleichung (9.3) kann eine statische Belohnungsfunktion u für einen 
Zustand x geschätzt werden. Diese Belohnungsfunktion u ist für die beiden 
Schiffstypen in Abbildung 9.4 dargestellt. Im Vergleich zueinander ist deutlich 
zu erkennen, dass sich Fischerboote näher an der Küste aufhalten. 


Abbildung 9.4: Aus der Kombination der einzelnen Merkmale resultierende Belohnungsfunkti- 
on U für Fischerboote (links) und Frachtschiffe (rechts) 
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Neben diesen Betrachtungen der Merkmalskarten f(x) und ihrer Gewichtun- 
gen 6 ist es außerdem möglich, Prädiktionen auf Basis des MaxEntIRL zu ge- 
nerieren. Im nächsten Schritt wird daher eine erste quantitative Bewertung 
der Möglichkeit zur Prädiktion von Trajektorien gegeben. Dafür werden Tra- 
jektorien anhand des gelernten Modells für bestimmte Anfangs- und Endzu- 
stände prädiziert und mit den tatsächlich abgefahrenen, aufgezeichneten Tra- 
jektorien verglichen. Die Schätzung wird dabei durch die approximierte op- 
timale Policy 7 generiert und für jeden Schritt wird dann die Aktion mit der 
höchsten Wahrscheinlichkeit ausgeführt, bis der Endzustand erreicht wird. 
Zum Vergleich werden Trajektorien auf Basis einer linearen Interpolation so- 
wie auf Basis des A*-Algorithmus verwendet. Beispiele für die Prädiktionen 
sind in Abbildung 9.5 zu sehen. 


Um den Abstand der prädizierten Verläufe zur originalen Trajektorie zu mes- 
sen, wird DTW mit der euklidischen Distanz als Abstandsmaß verwendet. 
DTW ermöglicht es, Zeitunterschiede in den Trajektorien besser zu berück- 
sichtigen. 


ERS 


Abbildung 9.5: Prädiktion von Schiffstrajektorien, links für ein Fischerboot und rechts für ein 
Frachtschiff. Die rote Linie ist die Prädiktion, die grüne eine lineare Interpolati- 
on, die blaue eine Prädiktion basierend auf dem A*-Algorithmus und die schwar- 
ze die ursprüngliche Trajektorie. Jedes Pixel stellt eine Gitterzelle dar. 


In Tabelle 9.1 sind die Abstände für die beiden Schiffstypen dargestellt. Für 
beide Typen liefern die MaxEntIRL-basierten Vorhersagen bessere Ergebnis- 
se. Dies bedeutet, dass die MaxEntIRL-basierten Vorhersagen im Durchschnitt 
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näher an der ursprünglichen Trajektorie liegen und somit das Verhalten bes- 
ser imitieren. 


Tabelle 9.1: Durch Dynamic Time-Warping bestimmte Distanzen zwischen den prädizierten und 
originalen Trajektorien 


Methode Fischerboot Frachtschiff 
Lineare Interpolation 4,3 + 3,7 2,4 +4,9 
MaxEntIRL 2,6 + 1,4 1,9 +1,8 
A*-Algorithmus 4,2 + 3,7 2,2 + 4,8 


Im Vergleich zwischen Fischerbooten und Frachtschiffen zeigt sich, dass Ma- 
xEntIRL im Fall von Fischerbooten eine größere Verbesserung der Prädiktion 
darstellt als bei Frachtschiffen. Ein Grund dafür könnten die oft geraden und 
direkten Routen der Frachtschiffe auf hoher See sein. Häufig ist daher die kür- 
zeste Verbindung zwischen dem Anfangs- und Endzustand bei Frachtschiffen 
die beste Annäherung an die originale Trajektorie. Gerade dieses Verhalten 
wird von den Vergleichsmethoden auch gut imitiert. 


9.4 Schlussfolgerung 


In diesem Kapitel konnte gezeigt werden, dass mit Hilfe von MaxEntIRL 
die Belohnungsfunktionen u zweier Schiffstypen eingelernt werden können. 
Hierbei wurden AIS-Daten und auf Basis von Hintergrundwissen erstellte 
Merkmalskarten verwendet, die unterschiedliche Charakteristika der Um- 
gebung aufgreifen. Die resultierenden Belohnungsfunktionen u wurden 
erfolgreich für die Prädiktionen von Trajektorien eingesetzt. Für die zwei 
untersuchten Schiffstypen wurden im Mittel bessere Ergebnisse als bei den 
Vergleichsverfahren erreicht. Inwieweit diese Verbesserungen signifikant 
sind, müssen weitere Untersuchungen zeigen. 


Durch die Diskretisierung des Gebiets können schmale Landmassen nur auf 
wenige Zellen abgebildet werden. Da ein diagonales Durchqueren des Ras- 
ters möglich ist, könnte die vorhergesagte Trajektorie bei ungünstiger Lage 
der Gitterzellen in der Realität undurchführbar sein. Dies ist aber zunächst 
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kein direktes Problem des MaxEntIRL-Ansatzes, sondern wird durch die ver- 
wendete Auflösung des Rasters bedingt. Diese wurde relativ grob gewählt, um 
eine handhabbare Zustandsraumgröße zu erhalten. 


Insgesamt bietet dieser Ansatz aber noch Raum für Optimierungen. Zum ei- 
nen werden die Merkmalskarten bisher nur linear miteinander kombiniert. 
Zum anderen werden die Merkmalskarten aus rein statischen Informationen 
generiert. Das heißt, dieser Ansatz berücksichtigt z.B. noch keine anderen 
Schiffe oder zeitliche Abhängigkeiten (bspw. Tageszeit). Des Weiteren kön- 
nen Arbeiten wie z.B. von Wulfmeier et al. [Wul15] herangezogen werden, 
um neuronale Netze zur Extraktion der Merkmale zu nutzen. 
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10 Detektion von komplexen 
Anomalien 


»Lerne die Situation, in der du dich befindest, insgesamt zu 
betrachten.« 


— Miyamoto Musashi 


Ergebnisse aus diesem Kapitel wurden im Rahmen des »Maritime Big Data 
Workshop« [Ann18b, Ros18a], des »2018 20th International Radar Symposi- 
um (IRS)« [Ann19b] und des »International Forum for the Military and Civil 
Simulation, Training and Education Community« [Ros19] vorgestellt. 


10.1 Problem und Zielsetzung 


Nachdem in den vorangegangenen Kapiteln gezeigt worden ist, wie Positions-, 
kinematische und kontextuelle Anomalien erkannt werden können, wird in die- 
sem Kapitel anhand einer Beispielanwendung ein Verfahren zur Detektion 
von komplexen Anomalien vorgestellt. Der entwickelte Algorithmus soll in 
Echtzeit reale Situationen erkennen und ihre Existenzwahrscheinlichkeit an- 
geben. Außerdem soll eine Bewertung der Zuverlässigkeit der unterschiedli- 
chen Informationsquellen in die Inferenz einfließen. 
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10.2 Methodik 


Wie bereits in Tabelle 2.3 gezeigt, wurden probabilistische graphische Mo- 
delle zuvor erfolgreich fiir die Detektion von komplexen Anomalien einge- 
setzt. Ein solches Modell ist ein DBN, das gegenüber einem Bayes’schen Netz 
um die Betrachtung der Zeitkomponente erweitert wird. Bei einem DBN wer- 
den hierbei diskrete Zeitpunkte miteinander in Bezug gesetzt. Die Zeitschrit- 
te werden auch als Zeitscheibe oder engl. »Slice« bezeichnet. Im Folgenden 
werden DBNs kurz eingeführt, weitere Details können bspw. [Bar14] oder 
[Mur12] entnommen werden. 


Ein DBN ist ein gerichteter Graph, in dem Zufallsvariablen X} als Knoten 
und ihre Abhängigkeiten (bedingte Wahrscheinlichkeiten) zueinander durch 
Kanten dargestellt werden. Der gesamte Graph ist azyklisch. Bedingte Wahr- 
scheinlichkeiten können nur innerhalb einer Zeitscheibe t oder zwischen zwei 
Zeitscheiben t und t— 1 beschrieben werden, im zweiten Fall aber immer nur 
(zeitlich) nach vorne gerichtet. Es kann also keine Rückkopplung entstehen. 


Ein einfaches Beispiel für ein DBN zusammen mit dem abgerollten Netz für 
zwei Zeitscheiben ist in Abbildung 10.1 dargestellt. Für die Eltern und Kinder 
der Knoten gilt eine verallgemeinerte Markov-Eigenschaft erster Ordnung, 
d.h., ein Knoten hängt nur von seinen unmittelbaren Eltern ab. Für die Zu- 
fallsvariablen X4, ..., X, kann dann die gemeinsame Wahrscheinlichkeitsver- 
teilung wie folgt beschrieben werden: 


P(X; Xn) = | [ PX: | Pax), (10.1) 
i=1 


hierbei stellt Pa(X;) die Elternknoten von X; dar. Für das Beispiel aus Abbil- 
dung 10.1 gilt dann 


Br ea aan, (10.2) 
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Informationen über den Wert von X; werden als Evidenz bezeichnet. Die 
Schätzung der Wahrscheinlichkeitsdichtefunktion für X; unter Berücksich- 
tigung aller Evidenzen wird Inferenz genannt. Verfahren dafür teilen sich in 
exakte (z.B. Variable-Elimination [Zha94]) und approximierte Inferenz (z.B. 
Importance-Sampling [Yua06]) auf. 


i 
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Abbildung 10.1: Beispiel für ein DBN, links kompakt und rechts ausgerollt. Orange gestrichelte 


Pfeile repräsentieren zeitliche Abhängigkeiten, während die schwarzen durch- 
gezogenen Pfeile die Abhängigkeiten innerhalb einer Zeitscheibe darstellen. 


Das DBN soll hier eine Situation nach Abschnitt 2.3.3 repräsentieren und eine 
Wahrscheinlichkeit für deren Existenz nachvollziehbar charakterisieren. Si- 
tuationen können in verschiedene Typen eingeteilt werden, die sich im Abs- 
traktionsgrad unterscheiden. In dieser Arbeit wird nach [Fis16] zwischen ele- 
mentaren Situationen und abstrakten Situationen unterschieden: Bei einer ele- 
mentaren Situation kann der Träger explizit modelliert werden. Damit folgt 
die Existenzwahrscheinlichkeit einer deterministischen Abbildung. Für eine 
abstrakte Situation kann die Unterstützung nicht explizit modelliert werden. 
Die Existenzwahrscheinlichkeit hängt also von der Existenz anderer (elemen- 
tarer oder abstrakter) Situationen ab. 


Situationen können voneinander abhängen. Die Beziehung ist entweder eine 
notwendige oder eine hinreichende Bedingung. Nach [Fis14] gilt: Eine Situa- 
tion A ist notwendig für eine andere Situation B, wenn die Existenz von B 
die Existenz von A impliziert, d.h. B — A. Eine Situation A ist hinreichend 
für eine andere Situation B, wenn die Existenz von A die Existenz von B im- 
pliziert, d.h. A > B. 


Die Situationen und ihre Abhängigkeiten können dann in ein DBN übertra- 
gen werden. Abbildung 10.2 veranschaulicht die Gesamtstruktur eines Netzes, 


167 


10 Detektion von komplexen Anomalien 


das im Rahmen des Projekts MARISA zum Erkennen illegaler Tauchgänge er- 
stellt wurde. Das Netz besteht aus zwei Ebenen: der Situationsebene und der 
Berichtsebene. Die Situationsebene wurde in Zusammenarbeit mit Fachleuten 
aus der Anwendungsdomäne aufgebaut und nach dem in [Fis16] beschriebe- 
nen Vorgehen modelliert. Bei diesem Ansatz hat jeder Knoten, der keine ele- 
mentare Situation darstellt, eine zeitliche Abhängigkeit zwischen zwei Zeit- 
scheiben mit sich selbst. 
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Abbildung 10.2: DBN zum Erkennen von illegalen Tauchgängen. Die Situationsebene besteht 
aus abstrakten Situationen (graue Knoten) und elementaren Situationen (blaue 
Knoten). Die Berichtsebene hat für jede Hypothese (elementare Situation) einen 
Berichts- (gelb), einen Zuverlässigkeits- (grün) und einen Quellknoten (rot). 
Einfarbige schwarze Pfeile sind bedingte Abhängigkeiten innerhalb einer Zeit- 
scheibe t, orange gestrichelte sind Abhängigkeiten zwischen den Zeitscheiben 
t und t — 1. [Ann19b] 


Nachdem die Netzwerkstruktur identifiziert worden ist, miissen die bedingten 
Wahrscheinlichkeitstabellen (engl. »Conditional-Probability-Table (CPT)«) 
für jedes Knotenpaar bspw. durch die Befragung von Fachleuten definiert 
werden. Dies würde die Einstellung einer großen Anzahl von Parametern zur 
Folge haben: Da es sich hier bei jeder Situation um eine binäre Zufallsvaria- 
ble handelt, würden die CPTs für eine Situation mit k Kindersituationen aus 
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2* +1 Einträgen bestehen. In [Fis16] wird ein Algorithmus zur Identifizierung 
der CPTs anhand von drei Parametern eingeführt: einer zur Abstimmung der 
Empfindlichkeit des Netzwerks auf positive Evidenzen, einer für diejenige 
auf negative Evidenzen und einer für das asymptotische Verhalten. 


Für die hier beschriebenen Netze wurden die CPTs für t = 0 unterstützt durch 
die Befragungen von Fachleuten [Ros18a] sowie durch Auswertungen eines 
Reliability-Game [Ros19] ermittelt. Details zu dem verwendeten Reliability- 
Game können [Ros18b] entnommen werden. Die Bestimmung der CPTs für 
t # 0 lehnt sich an die Vorgaben aus der Arbeit [Fis16] zum asymptotischen 
zeitlichen Verhalten an. 


Bei der Verwendung eines DBNs für maritime Überwachungsaufgaben 
können Evidenzen aus unterschiedlichen Informationsquellen (siehe Ab- 
schnitt 2.2) generiert werden. Um diesen Umstand abzubilden, wird die 
Netzstruktur, die zunächst nur eine Situationsebene beinhaltet, um eine 
Ebene erweitert: die Berichtsebene. Diese Schicht erlaubt eine individuelle 
Berücksichtigung der Zuverlässigkeit der Informationsquellen. 


Abbildung 10.3: Bericht-Zuverlässigkeit-Quelle-Struktur 


Wie in [Ros18a] beschrieben, gibt es für jede Variable H; der Situationsebene, 
auf der es möglich ist, einen direkten Bericht zu erhalten, eine wie in Ab- 
bildung 10.3 dargestellte verbundene Bericht-Zuverlässigkeit-Quelle-Struktur. 
Die Struktur basiert auf dem in [Bov04] vorgeschlagenen Modell, in dem die 
Zuverlässigkeit als endogene Variable modelliert wird. Dieses Modell wird 
in Anlehnung an den Ansatz in [Fen12] weiter ausgebaut, um die Faktoren 
zu berücksichtigen, die die Quellenzuverlässigkeit bestimmen. Diese Faktoren 
werden als Eltern des Zuverlässigkeitsknotens Rel; modelliert. Da hier nur der 
Quellentyp als Faktor modelliert wird, umfasst die aktuelle Implementierung 
des Netzes nur einen Elternfaktor (Source;) von Rel;. Die Evidenzen werden in 
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die Knoten Rep, und Source; eingegeben und über das Netz propagiert, sodass 
sowohl die Vielfalt als auch der potenzielle Unterschied in der Zuverlässig- 
keit der Quellen berücksichtigt werden kann. 


10.3 Ergebnis 


Die DBN-basierte Situationserkennung wurde im Rahmen des Projektes MA- 
RISA erprobt. Das Ziel des MARISA-Projekts ist die Erhöhung des mariti- 
men Situationsbewusstseins durch ein umfängliches Verständnis der Situa- 
tion auf See. Das entwickelte System soll Betreiber von Überwachungssys- 
temen, z.B. Küstenwachen, bei der Beobachtung, Identifizierung und Bewer- 
tung von Schiffen bzw. Anomalien unterstützen. Außerdem werden die The- 
men der Einsatzplanung auf See, der Zusammenarbeit zwischen den grenz- 
übergreifenden Behörden und der effizienten Nutzung der vorhandenen Res- 
sourcen adressiert. MARISA zielt darauf ab, den Austausch zwischen den Be- 
hörden und den Anbietern von Datenfusionsdiensten zu fördern, um eine 
maßgeschneiderte Lösung für ein breites Spektrum an Sensoren und Daten zu 
liefern. Dafür wurde eine Reihe an Werkzeugen zur Anreicherung und Ana- 
lyse der verfügbaren Daten entwickelt und während sogenannter Live Trials 
in verschiedenen Gebieten der EU zusammen mit Endanwendern/Endanwen- 
derinnen erprobt. 


Einer der wichtigsten Aspekte der entwickelten Werkzeuge ist die Informati- 
onsfusion der verfügbaren Informationsquellen zu einem gemeinsamen RMP. 
Dieser Prozess schließt Quellen ein, die über die klassischen maritimen Quel- 
len (siehe Abschnitt 2.2) hinausgehen, wie z.B. Open-Source-Informationen 
aus den sozialen Medien bzw. allgemein aus dem Internet, wobei die volle 
Kontrolle über die Nutzung der verschiedenen Eingangsströme beim Men- 
schen verbleibt. Darüber hinaus erleichtert es die Integration der bereitge- 
stellten Quellen, um benötigte Informationen bei Bedarf länderübergreifend 
auszutauschen. 
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Für die Live Trials werden jeweils für die verschiedenen Endnutzer maßge- 
schneiderte Versionen bereitgestellt und evaluiert. Dafür werden die Datenfu- 
sionsdienste sowie Vernetzungs-, Integrations- und Präsentationsdienste auf 
die Bedürfnisse der einzelnen Versuche zugeschnitten. Um den Endnutzern 
den größten Mehrwert zu bieten, werden sie bei der Entscheidung über Mög- 
lichkeiten zur Nutzung einbezogen. Diese bestehen neben der Anzeige der 
durch Altsysteme bereitgestellten Funktionen auch in der menschlichen In- 
teraktion mit dem System sowie in der Verarbeitung und Bewertung mit Hilfe 
spezieller Algorithmen. Das Projekt war in zwei Phasen aufgeteilt, die jeweils 
mit Live Trials abgeschlossen wurden. Die Erkenntnisse aus der ersten Pha- 
se konnten damit direkt in die Weiterentwicklung der verschiedenen Dienste 
und Algorithmen einfließen und in der zweiten Phase evaluiert werden. 


Die DBN-basierte Situationserkennung wurde insbesondere im Rahmen des 
»North Sea Trials« mit der niederländischen Küstenwache erprobt. Zu den 
Zuständigkeiten der Küstenwache gehören unter anderem die Gewährleis- 
tung einer verantwortungsvollen Nutzung der Nordsee, die Gewährleistung 
von Sicherheit und Gefahrenabwehr auf See und die Einhaltung nationaler 
und internationaler Gesetze und Pflichten. Wie in Abschnitt 3.2 beschrie- 
ben wurde der Versuch vor der Küste der Niederlande durchgeführt. Als 
Datenquelle wurden von der Küstenwache Daten im IVEF-Format (siehe 
Abschnitt 2.2.4) bereitgestellt. Zusätzlich konnten über die Benutzerober- 
fläche weitere Informationen händisch in das System eingegeben werden. 
Im Rahmen des Live Trials wurden von der niederländischen Küstenwache 
verschiedene Situationen durch eigene Schiffe simuliert: illegale Tauchgänge 
an Schiffswracks, Schmuggel auf See und eine Seenotrettungsoperation. Im- 
pressionen und weitere Details zur Versuchsdurchführung sind in [Ann19b, 
Moh19] veröffentlicht. 


Zur Konfiguration des Systems wurden durch den/die Anwender/-in Infor- 
mationen zum Einsatzgebiet, zu vorhandenen Schiffswracks und Bojen so- 
wie den Umweltbedingungen (z.B. Seegang und Sichtbedingungen) in das 
System eingegeben. Zur Alarmierung beim Auftreten der Situationen wurde 
ein Schwellwert für die Existenzwahrscheinlichkeit der Situation festgelegt. 
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Im Folgenden wird der Anwendungsfall der illegalen Tauchgänge näher be- 
schrieben. Diese Aktivität ist für die niederländische Küstenwache aufgrund 
von Schiffswracks aus der Zeit der niederländischen Ostindien-Kompanie von 
besonderem Interesse. 


Zur Bestimmung der Existenzwahrscheinlichkeiten wird für jedes Schiff 
im Überwachungsgebiet eine Instanz des DBN aus Abbildung 10.2 erstellt. 
Evidenzen werden jeweils in den Rep,-Knoten gesetzt. Die dazugehörigen 
Source;-Knoten werden je nach Typ der Quelle auf »AIS«, »Radar« oder 
»menschliche Eingabe« gesetzt. Evidenzen, die nicht direkt aus den IVEF- 
Daten abgeleitet werden können, werden von dem/der Anwender/-in einge- 
stellt. Dies umfasst insbesondere die Umweltbedingungen Wetter, Gezeiten 
oder Sicht. Die kinematischen Informationen des Schiffes, z.B. Position und 
Geschwindigkeit, werden automatisch aus dem verfügbaren IVEF-Datenstrom 
abgeleitet. Für die abstrakten Situationen zur Schiffsposition werden die Po- 
sitionsdaten zusammen mit menschlichen Eingaben über die Position von 
Schiffswracks, Bojen und anderen Bereichen von Interesse verwendet. 


Da die einzelnen Knoten binäre Zufallsvariablen repräsentieren, werden die 
Evidenzen wenn nötig durch Schwellwerte in binäre Aussagen übertragen. 
Dies ist z.B. für die Hypothese H, »Null speed« zur Bestimmung eines sich 
nicht bewegenden Schiffes nötig, da sich Schiffe durch Strömungen und Wind 
auf See auch ohne eigenen Antrieb leicht bewegen können. Für die Netze wird 
global bestimmt, über wie viele Zeitscheiben sie definiert sind und wie lang 
eine Zeitscheibe dauert, bspw. ergeben zehn Zeitscheiben und eine Länge von 
je einer Minute eine Beobachtungszeit von zehn Minuten. 


Während der Live Trials im Rahmen des MARISA-Projektes wurden alle mo- 
dellierten Situation erkannt und der/die Anwender/-in wurde jeweils alar- 
miert. Dies wurde im Echtzeitbetrieb erreicht. Außerdem gab es während der 
verschiedenen Versuchsphasen keine Fehlalarme. Neben dem hier vorgestell- 
ten Beispiel zur Detektion von illegalen Tauchgängen wurden weitere Netze 
erstellt, um bspw. Schmuggelaktivitäten zu erkennen. Diese wurden im Pro- 
jektrahmen in anderen Live Trials erprobt [Mou19]. 
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Es konnte in diesem Kapitel gezeigt werden, wie ein Algorithmus zum Er- 
kennen komplexer Situationen genutzt werden kann. Hierbei wurde auf eine 
Modellierung durch DBNs zurückgegriffen. Dies ermöglicht im Vergleich zu 
rein logisch operierenden regelbasierten Ansätzen eine Ausgabe von Wahr- 
scheinlichkeiten für die einzelnen Teilsituationen. Durch die übersichtliche 
Darstellung ist es möglich, Ergebnisse nachzuvollziehen und damit weitere 
Entscheidungen fundiert zu begründen. Außerdem wurde gezeigt, wie die Zu- 
verlässigkeit unterschiedlicher Datenquellen modelliert werden kann. 


Für zukünftige Entwicklungen muss das Erstellen der Netzstruktur sowie das 
Erheben der CPTs vereinfacht werden. Auch wenn bspw. die Arbeiten von 
Fischer [Fis16] gezeigt haben, wie durch drei Parameter die CPTs für die Zeit- 
scheiben t # O gesetzt werden können, reicht dies nicht aus, um für alle 
Zufallsvariablen die bedingten Wahrscheinlichkeiten zu bestimmen. Der hier 
gewählte Weg über einen spielerischen Ansatz in Form des »Reliability-Ga- 
mes« stellt sich in Hinblick auf die Kooperationsbereitschaft der Endanwen- 
der/-innen als eine deutliche Verbesserung gegenüber der Befragung in Form 
von länglichen Fragebögen heraus. Ein weiterer Punkt ist die Wiederverwend- 
barkeit von Komponenten vergleichbar mit der objektorientierten Program- 
mierung. Konzepte dafür sind bspw. Multi-Entity Bayesian Networks. Dies soll 
es einem Nutzer ermöglichen, schneller und einfacher Netzstrukturen für den 
eigenen Anwendungsfall aufzubauen. 
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»Eine gute Idee löst nicht nur ein einzelnes Problem, sondern 
kann mehrere Probleme gleichzeitig lösen.« 


— Shigeru Miyamoto 


11.1 Zusammenfassung 


In dieser Arbeit wurden verschiedene Mittel und Wege aufgezeigt, um in 
räumlich-zeitlichen Daten Anomalien zu erkennen. Hierbei wurde zwischen 
Positions- und kinematischen Anomalien, kontextuellen Anomalien und kom- 
plexen Anomalien unterschieden. Als Anwendungsdomäne für die Evaluation 
der Verfahren wurde der maritime Raum gewählt. Als Grundlage für die 
durchgeführten Arbeiten wurde zunächst das OOWM um Verhaltensmodelle 
erweitert. 


Da Positions- und kinematische Anomalien ohne weitere Kontextinformatio- 
nen erkannt werden können, wurden im nächsten Schritt verschiedene Ver- 
fahren zur Anomaliedetektion basierend auf einzelnen Datenpunkten und auf 
Trajektorien vorgestellt und erprobt. Für einfache Anomalien sind diese aus- 
reichend, beim Auftreten von komplexeren Situationen (bspw. der Interaktion 
zwischen Schiffen) reichen diese Ansätze nicht aus. 


Im nächsten Schritt wurden daher Verfahren erprobt, die Kontextinformatio- 
nen verarbeiten können. Dies wurde zum einen in einem spieltheoretischen 
Modell zur Simulation von Schiffsbewegungen und zum anderen durch ein 
CNN zur Klassifikation von Schiffstypen gezeigt. Das spieltheoretische Mo- 
dell basiert auf Nutzenfunktionen, deren Erstellung in weiteren Iterationen 
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sowohl durch Expertenwissen als auch durch datengetriebene Verfahren dar- 
gestellt wurde. Für die Schiffstypklassifikation wurden weitere georeferen- 
zierte Informationen in den Merkmalsraum aufgenommen, um so dem neu- 
ronalen Netz einen gewissen Kontext mitzugeben. 


Zuletzt wurden komplexe Anomalien in Live Trials mit Hilfe von DBNs detek- 
tiert. Den DBNs wurden Kontextinformationen zum Wetter oder Informatio- 
nen zu geographischen Besonderheiten bereitgestellt. Dabei wurde die Zuver- 
lassigkeit der zugrundeliegenden Quellen modelliert und in der Auswertung 
beachtet. Außerdem wurden Ergebnisse aus anderen automatischen Verfah- 
ren, die innerhalb des MARISA-Projekts bereitgestellt wurden, als Basis zur 
Generierung der Evidenzen benutzt. 


Insgesamt konnte gezeigt werden, dass 


« das OOWM um Verhaltensmodelle erweitert werden kann, 


e einfache Positions- und kinematische Anomalien zwar erkannt werden, 
aber ohne Kontextinformationen unzureichende Ergebnisse 
resultieren, 


e das Schiffsverhalten durch spieltheoretische Konzepte abgebildet 
werden kann, 


« Schiffstypen durch neuronale Netze zuverlässig erkannt werden 
können, 


« datengetriebene maschinelle Lernverfahren die Erstellung von 
Nutzenfunktionen unterstützen können und 


e komplexe Anomalien in Echtzeit unter Beachtung der Zuverlässigkeit 
verschiedener Sensorquellen erkannt werden können. 


Damit wurden die aufgestellten Ziele aus Abschnitt 1.2 erreicht und die For- 
schungshypothesen bestätigt. 
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Während in dieser Arbeit verschiedene Ansätze zur Anomaliedetektion in 
räumlich-zeitlichen Daten anhand eines maritimen Anwendungsszenarios 
gezeigt wurden, sollte in zukünftigen Arbeiten die Übertragbarkeit auf an- 
dere Domänen untersucht werden. Ein Anwendungsfeld mit einer ähnlichen 
Datenbasis ist bspw. der Flugverkehr. 


Es wurde hier insbesondere die Machbarkeit überprüft. Zum täglichen Einsatz 
bei Küstenwachen und anderen Stakeholdern besteht jedoch weiterer Ent- 
wicklungsbedarf. So muss es Einsatzkräften möglich sein, die Verfahren an die 
jeweiligen Gegebenheiten möglichst intuitiv anzupassen. Dafür ist zum einen 
die Darstellungskomponente, zum anderen die Benutzerführung wichtig. Zur 
weiteren Entwicklung stellen sich hier etwa die Fragen, welche Hilfestellun- 
gen benötigt werden oder wie hoch Falschdetektionsraten ausfallen dürfen, 
um dem Nutzer tatsächlich hilfreiche Informationen zu geben. 


Da die hinterlegten Modelle teilweise Black-Box-Modelle sind (insbesondere 
Deep-Learning-basierte neuronale Netze), ist es weiterhin wichtig, für kriti- 
sche Situationen die zusätzlichen Informationen in geeigneter Form aufzube- 
reiten. Zu diesem Forschungsfeld zählt das Thema erklärbare künstliche Intel- 
ligenz. Die Idee ist hier, Erklärungen für die Klassifikationen der neuronalen 
Netze (oder anderer Modelle) zu geben. Diese sollen für einen Menschen nach 
Möglichkeit ohne spezielles Hintergrundwissen zu den verwendeten Techno- 
logien transparent die jeweiligen Sachverhalte darlegen, sodass der Mensch 
begründet auf diesen Informationen seine Entscheidung treffen kann. 


Weiterhin sollte die Kombination der verschiedenen Ansätze stärker unter- 
sucht werden, um so hybride Verfahren basierend auf datengetriebenen und 
wissensbasierten Ansätzen aufzubauen. Bestimmte Verfahren, die weniger 
Ressourcen benötigen, bspw. zur Erkennung von statistischen Ausreißern 
(vgl. Kapitel 5), können als vorgeschalteter Filter fungieren, um mit an- 
deren Verfahren (vgl. Kapitel 10) spezifische Situationen zu identifizieren. 
Außerdem ist es denkbar, die Ergebnisse von unterschiedlichen Verfahren, 
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wie dies bereits in kleinerem Mafie im MARISA-Projekt gezeigt wurde, zu 
kombinieren. 
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Conv 3 - Stride 2 


Max Pooling - Stride 1 
Conv1-Stride 1 


Conv1-Stride 1 


Global Avg. Pooling 
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A Schematische Darstellungen der untersuchten ResNet-Architekturen 


Conv 3 ~ Stride 2 


Conv 1 ~ Stride 2 


Input 
+ Y v Y Y Y ý v Y 
Conv 3 - Stride 2 
vi 
ReLU 
Max Pooling - Stride 1 
Conv 1 ~ Stride 1 Conv 1 — Stride 1 
ReLU 
= 
Conv 1 — Stride 1 O 
Q 
Pr > 117 [1x ||> || 5 
NE: alps 
ReLU allay] all > = Olle 
ont me) o o ® w % 
Conv 3 - Stride 2 Conv 1 = Stride 2 a a = © Oo 
O olll o Oji all olla 
y © oji Q || VI} ci j|] O 
ReLU I) d] (eD) ‚o q= © = — 
© © I5 | oO ® (©) 
v - | Si ej Sia Ol| o 
Conv 3— Stride 1 Z b EIlEll w AKO) = Q 
= acid |= E 
see ol AlS 
ReLU o|\lo||<||— is 
= u 
QO 


ReLU 


v 
Conv 3 — Stride 1 


Glo 


bal Avg. Pooling 


Concatenate 


Abbildung A.5: Total Split ResNet 
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Abbildung A.6: Split ResNet 
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